Tout le monde échange des banalités à ce sujet, répétant à l’envie que « les données sont le nouvel or noir », que « la transformation digitale est partout », que « data scientist » est la profession la plus sexy du moment et que le volume de données échangé dans le monde est muliplié par… euh… beaucoup ! Du coup, vous vous y intéressez et essayez encore de comprendre ce terme obscur et mal défini..
Rassurez-vous… Nous avons une bonne nouvelle pour vous : le Big data est mort ! plus besoin de vous y intéresser. Il vous suffit de rêver !
Sans revenir sur la définition du Big Data, que ce soit la définition très générique donnée par le Gartner autour des 3 V (Volume, Velocity et Variety), ou les définitions très personnelles de chaque acteur souhaitant se démarquer (et ajoutant tantôt une « Veracity », tantôt un « Datalake » ou encore de l’« Open Source »), force est de constater que l’on commence enfin à se poser la Vraie Question : à quoi ça sert ? hé oui, au-delà de la révolution technique, quel est vraiment l’apport pour les entreprises ? pour les opérationnels ? pour le Business ?
Nous avons depuis plusieurs années pris l’habitude d’évaluer le potentiel que représentent les données et d’aider nos clients à en tirer le meilleur parti, rendant les équipes plus performantes et plus réactives. Il en ressort 4 domaines d’utilisation majeur : ce sont nos « 4 A » en réponse aux 3 V du Gartner !
À pour Analyse : une des utilisation historique du Big Data consiste à stocker et parfois analyser des données historiques. Ça a été le grand essor d’Hadoop. C’est la réaction de la fourmi qui fait des provisions pour l’hiver… on me dit que mes données sont importantes, du coup, je vais les stocker pour plus tard, on ne sait jamais de quoi l’avenir sera fait. Et à partir de là, une fois que les données ont été « historisées », s’est posée la question de son exploitation. Sont alors apparues les notions de « Data visualization », d’analyse, de modèles statistiques, etc… Les premières utilisations ont tourné autour de la compréhension du comportement (ou du parcours) client en regardant l’historique, c’est-à-dire dans le rétro…
À pour Action : une autre grande famille de cas d’utilisation tourne autour de l’Action, c’est-à-dire non plus le stockage des données, mais la réaction à chaud. Ici, la dimension temps est totalement différente car orientée sur le Temps Réel. Il s’agit de détecter, à la volée, des événements ou des signaux faibles pour déclencher des actions. Là encore les premiers cas d’utilisation ont été focalisés « relation client », et sont apparus dans les sites web. Il s’agit de la personnalisation de contenu qu’on retrouve sur les site Web (Amazon en tête), ou la personnalisation des bannières (merci Critéo). En fonction de votre comportement, on vous oriente sur ce que vous avez le plus de chances d’acheter… mais nous verrons qu’il n’y a pas que ça !
À pour Anticipation : 3ème cas d’utilisation, celui qui est présenté par le Graal de tout manager… l’anticipation ! c’est-à-dire la capacité à partir des données de prévoir le futur. On entre ainsi dans le domaine du prédictif, du forecast, voire comme le disent d’autres (IBM se créant ainsi son marché), l’ère du cognitif qui va permettre de préanalyser les données et de faciliter la prise de décision. Quelle que soit la terminologie, l’idée est bien de détecter et prévoir les tendances, anticiper les réactions des clients, d’utiliser une boule de cristal technologique et de « factualiser » les décisions managériales ou opérationnelles.
En enfin, A pour… Argent. Il s’agit ici de valoriser les données disponibles et surtout de les monétiser, d’en faire une source de revenu.. Puisqu’on me dit qu’elles ont de la valeur, autant les rentabiliser ! On retrouve ce cas d’utilisation surtout chez des nouveaux acteurs ou sur des nouveaux business models qui vont se créer avec l’objectif de tirer parti de la donnée disponible (que ce soit l’Open Data ou des données de partenaires). Dans les secteurs plus traditionnels, la plus petite utilisation des données génère souvent une levée de bouclier. Certaines banques qui ont annoncé qu’elles envisageaient de revendre des analyses sur le comportement consommateur de leur clients en ont fait les frais. Sans même parler du cadre légal qui reste peu adapté…
Ça vous semble encore un peu flou ? Alors soyons plus concrets ! Chez Mind7 Consulting, nous avons décliné ces cas d’utilisation en nous intéressant à 3 problématiques bien précises : les processus, la vue 360° et la réaction en temps réel.
Dans le domaine des processus, l’utilisation que nous faisons des données et des principes des démarches Qualité vont permettre de « mettre sous contrôle » les activités de l’entreprise. La définition des processus est parfois dans les mœurs, via des outils de modélisation (le BPM est passé par là), mais au-delà de cela, la capture en continu des données permet de détecter au plus tôt la moindre variation dans l’activité, d’identifier les risques et de prendre des décisions opérationnelles au plus tôt. Au-delà de cela, l’analyse des données historiques va permettre de comparer les instances de processus qui ont été performantes avec celles qui l’ont été moins ; à partir de là des actions correctives vont être mises en place pour améliorer le processus. Qu’il s’agisse d’un processus de paiement, de commande, de livraison ou encore de traitement de dossiers, nous avons identifié des améliorations significatives chez nos différents clients.
La vue à 360° d’un sujet, qu’il s’agisse d’une vue client, produit, magasin, ou encore de veille automatisée du Web et des réseaux sociaux, vise à donner à nos clients une meilleure compréhension de leur contexte. Ainsi les données vont être capturées dans les différents silos d’information et mis en commun. A partir de là, l’information est exploitable : on peut la retrouver (c’est parfois déjà beaucoup) mais aussi l’analyser. Ainsi lorsque je suis en interaction avec un client, je dispose de toutes les informations qui le concernent ; lorsque je dois lancer un produit, je dispose des informations sur le marché, les tendances, la concurrence… On pourrait se limiter à des outils traditionnels tels que la Business Intelligence, mais les moteurs de recherche (parfois couplés avec des algorithmes d’analyse) donnent selon nous des possibilités plus étendues.
Enfin, la réaction en temps réel. C’est selon nous un enjeu majeur des entreprises : être en capacité de réagir au plus vite et d’adapter en permanence leurs organisations. La mise en place de solutions et d’applications nativement orientées temps réel, que ce soit des solutions de streaming analytics chez certains éditeurs ou des solutions open source telles que Spark ou Flink, permet de mettre plus de souplesse et de réactivé dans les activités métier. La mise en place des méthodes agiles et itératives ainsi que les évolutions de l’exploitation informatique (DevOps par exemple) permettent de délivrer plus rapidement. La finalité de tout cela, c’est d’améliorer sans cesse la performance de l’organisation : éviter la fraude, surveiller l’activité, déployer de nouvelles offres plus rapidement, améliorer l’interaction client, etc… là encore, la donnée devient un atout : si je peux détecter une fraude avant qu’elle ne se manifeste, si je peux prévenir un client d’un délai ou lui offrir un nouveau service, alors j’aurais effectivement tiré profit de mes données !
On le voit, le Big Data est né et a fait le buzz avec un discours extrêmement technicien (les principaux intervenants du marché sont des vendeurs de solutions et de technologies) mais l’utilisation que les organisations peuvent en faire est réelle et surtout commence à se mettre en place. La finalité reste toujours la même : rendre les entreprises plus performantes et plus réactives, pour au final mieux servir son client.
Le Big Data technique est mort… Vive le Big Data métier !