Fabrice Henry, Managing Partner, Artefact France, a suivi la discussion. Parmi les participants figuraient Johan Picard, Data Analytics Practice Lead, EMEA, Google ; Jean-Noël Lucas, Chief Data Governance Officer, L'Oréal ; Brice Miranda, Data, AI & Automation Deputy, Orange ; Jean Christophe Brun, Président-Fondateur, Univers Data.
Comment data mesh peut-il répondre aux défis de l'architecture centralisée data et contribuer à une meilleure utilisation data par le personnel opérationnel ? Tel était le thème central de la troisième matinéeArtefact's Data , au cours de laquelle des dirigeants ayant une vaste expérience dans le domaine data se sont réunis pour partager leurs points de vue et des exemples concrets de ce qu'est data mesh, de la manière dont il est mis en œuvre dans leurs entreprises et des promesses qu'il offre pour l'avenir.
Tout d'abord, un bref rappel du qui, du quoi et du pourquoi de data mesh: la notion a été conçue par Zhamak Dehghani de ThoughtWorks comme un moyen d'améliorer l'accessibilité de data et de simplifier l'organisation dans des structures data centralisées et monolithiques. L'explosion de data pendant la pandémie de COVID-19 a accentué ces besoins, et data mesh a maintenant évolué d'un concept à un modèle d'architecture distribuée pour rendre data utilisable par tous au sein d'une organisation.
Comment éliminer le goulot d'étranglement "data pour les experts data uniquement" ?
Johan Picard de Google a quelques idées : "Cela tient en partie à la simple maturité de data . Pendant vingt ans, les entreprises ont créé et centralisé leurs data sur des plates-formes, data des lacs, data des entrepôts. C'est ce qui leur a permis d'exploiter leur data. Mais les domaines devaient faire la queue pour accéder à ce data, ce qui provoquait des retards et des goulets d'étranglement.
"Certains sont allés jusqu'à créer leur propre département informatique fantôme, car les équipes informatiques comprennent la technologie mais pas la qualité des data. Et l'inverse est vrai pour le domaine. Mais aujourd'hui, avec le cloud, les technologies évoluent et permettent de décentraliser les data vers les domaines. Il est important de se rappeler qu'il s'agit d'une approche inspirante. Chaque entreprise est différente et doit viser la décentralisation à sa manière, en tenant compte de son contexte, de sa vitesse et de ses ambitions.
A Orange, Brice Miranda a expérimenté ce phénomène de concentration et de fragmentation des data . "Notre plateforme de data historiques n'était pas orientée self-service, donc beaucoup de nos équipes ont créé leurs propres mini plateformes de data ; nous nous sommes retrouvés avec entre 40 et 60." L'opérateur a construit une plateforme pour servir ses équipes de domaine avec Google Cloud Platform. "Et maintenant, nous entrons dans la logique de la démocratie des data ".
Avant de créer son entreprise à la fin de cette année, Jean-Christophe Brun était directeur technique de Carrefour. "En 2015, nous savions que nous devions transformer notre vision de data, pour centrer notre activité de vente au détail autour de data. Jusqu'en 2018, nous construisions une plateforme on-premise pour devenir plus data-centric. Et en 2018, nous sommes devenus un partenaire de Google pour en faire plus avec les algorithmes. Avant même de connaître la notion de data mesh, notre objectif était de multiplier les usages métiers. Ce que j'aime dans data mesh, c'est qu'il nous permet de formaliser des choses que nous n'avions pas standardisées, de mettre des mots sur les principes."
Jean-Noël Lucas chez L'Oréal a entamé la même démarche il y a trois ans. Jean-Paul Agon, alors PDG, a fixé le cap : être le champion de la beauty tech. Pour cela, il fallait orchestrer le data et casser les silos fonctionnels, identifier les data stewards, se mettre d'accord sur un langage commun et structurer le data, pour construire un référentiel global. Et pour cela, il fallait des ressources : "Il faut gagner du temps pour rendre le site data disponible. Nous avons évalué la dette de gouvernance (deux ou trois ans) et estimé les ressources nécessaires pour gérer l'entreprise autour du data. Nous avons consacré une équipe de 100 personnes à la préparation du data. Nous avons intégré de nouvelles compétences dans le groupe. Nous faisons aussi beaucoup d'évangélisation répétée pour conserver le budget qui nous permet de faire cet effort. Car les L'Oréaliens ne sont pas conceptuels. Nous devons traduire le concept en termes concrets".
L'Oréal énumère 50 cas d'utilisation qui exploitent le produit data. De la gestion du portefeuille de produits à l'amélioration de la distribution, en passant par la gestion des stocks. "Avec data comme stratégie produit, data est distribué aux différents domaines et sa préparation est confiée aux spécialistes de chaque marque, ce qui résout le problème du goulot d'étranglement", conclut Jean-Noël.
Comment démocratiser data à l'échelle de l'entreprise ?
Même si Orange dispose d'un studio data pour la consultation et de Collibra pour la recherche sur data, cela ne suffit pas : "Quand on fait des dépôts sur data , on se retrouve avec des doublons et cela pose des problèmes. Si on demande l'équipement haut débit des clients, on obtient 800 réponses". Le client est-il équipé en fixe, en mobile, en fibre ? L'outil ne le sait pas. Le client a-t-il donné son accord ? Nous ne le savons pas non plus. Il n'existe pas de source unique de vérité ou de data à laquelle on puisse se fier. C'est pourquoi des POC sont menés sur ces questions (" Qu'est-ce qu'un client Orange ? " " Qu'est-ce que l'autorisation ? ").
Orange est un peu plus avancé que L'Oréal, où 40 % des data sont disponibles dans le cloud. "La condition préalable est que data soient disponibles et consultables", déclare Jean-Noël. "Ensuite, nous devons remonter les domaines de la chaîne de valeur data , avec la consommation des data comme critère de performance (KPI), pour nous rapprocher des cas d'utilisation de l'entreprise. Derrière cela, il y a le défi de la culture des data , qui consiste à amener les gens à adopter des solutions plus standardisées et à en voir la valeur réelle."
"Chez Carrefour, nous avons choisi de responsabiliser les propriétaires de nos produits data ", explique Jean-Christophe. Ils comprennent l'utilité de data et en assurent la communication : "Les produitsData doivent être utilisés. Les propriétaires de produits Data doivent s'intéresser à l'utilisation de leurs produits". Auparavant, le service de veille stratégique rendait compte aux domaines. Aujourd'hui, ce sont les domaines eux-mêmes qui s'en chargent, avec le soutien de la BI. Soixante pour cent des personnes formées par Carrefour sur data venaient des domaines."
Comment industrialiser avec succès les cas d'usage ?
Johan Picard explique qu'il s'agit d'un processus de va-et-vient entre l'analyse et les opérations : "Le site data doit remonter vers l'analytique et redescendre vers l'opérationnel. Dans le passé, les bases de données ne pouvaient pas intégrer l'analyse, nous avons donc créé le lac data . Dans le nouveau paradigme, nous sommes plus proches des bases de données. Dans le nouveau paradigme, nous sommes plus proches des sources data et nous les comprenons mieux. Par conséquent, nous n'avons plus besoin de séparer les opérations et l'analyse. Certains de nos clients les ont placés sur le même plateau. Les spécialistes SAP côtoient les spécialistes data . Brice Miranda partage cet avis et ajoute : "Nous devons effacer les anciennes frontières entre l'analyse et les opérations et aller à la source".
Pour Jean-Noël Lucas, "les opérationnels doivent comprendre sur quel data ils s'appuient (en réfléchissant à leurs processus) et s'efforcer d'améliorer la qualité de data ." Par exemple, pour approvisionner les magasins et mieux gérer les stocks, L'Oréal a ajouté une couche à la GCP. Nous voulons "API-iser" nos systèmes. L'Oréal a beaucoup travaillé sur le produit data afin de mettre une vue à 360° à la disposition des détaillants et des consommateurs. Pour mieux gérer sa chaîne d'approvisionnement, L'Oréal doit mieux segmenter ses catalogues. Et la nouvelle organisation permet d'être plus réactif, de passer des ordres de production de produits sur une base hebdomadaire, lorsque la demande augmente.
Carrefour est allé le plus loin dans la convergence de l'analyse et des opérations : dans ce nouveau monde, l'analyse devient un outil opérationnel en temps réel, au même niveau de service que les opérations. "La fiche produit doit enregistrer tous les data, y compris les chiffres de vente. Cela permet d'établir des scores de substitution entre les produits, au cas où un produit viendrait à manquer. C'était impensable il y a trois ans", conclut Jean-Christophe.