Data gouvernance : la nouvelle colonne vertébrale des entreprises
⏱ 7 minDepuis environ cinq ans, de plus en plus d’entreprises s’attellent à mettre en place la gouvernance de leurs données pour en garantir la qualité, le partage, la sécurité et générer de la valeur. Un chantier de longue haleine, souvent mené sous la contrainte. Avec à terme la promesse d’une véritable transformation digitale et la création de nombreuses plus-values.
Les données d’une entreprise constituent son patrimoine et traduisent son savoir-faire. Bien les gérer est une évidence, tant pour innover que pour répondre aux différentes contraintes réglementaires. Dans la pratique, c’est une autre histoire, notamment parce que ce flux est devenu particulièrement massif ces dernières années. Une histoire qui est en train de s’écrire pour la plupart des entreprises, mises à part celles dont les dirigeants ont un ADN tech et sont organisées d’emblée autour de la circulation des données à l’instar d’Amazon. Pour les autres, c’est un sacré challenge organisationnel qui prendra des années, selon la taille de l’entreprise.
« Tout le monde est persuadé qu’il faut s’y mettre, résume Jean-Pascal Perrein, CEO de 3org, cabinet de mentorat en gouvernance de l’information, mais la plupart des entreprises ne sont pas mûres. Beaucoup confondent encore la notion de gouvernance, à proprement parler, qui est du ressort de l’organisation de l’entreprise, avec les pratiques opérationnelles plus orientées vers la gestion des donnéesLa gestion des données désigne l’ensemble des pratiques nécessaires à la construction et maintenance d’un cadre/framework pour l’importation, le stockage, l’exploration et l’archivage des données qui sont nécessaires aux activités de l’entreprise. Source : https://fr.talend.com/resources/what-is-data-management/ concernant leur qualité ou les données de référence (références produit, numéro de sécurité sociale, identifiants client, numéro de facture ou commande, etc.) comme le Master Data Management« single version of the truth » ou « golden records ». Cette non-redondance lui permet de prendre des décisions plus efficaces et d’assurer de façon adaptée leur traçabilité cohérente.. Beaucoup de CEO ou de DSI (directeurs des systèmes d’information) veulent faire de la gouvernance des données mais n’ont pas de vue globale. Sachant que gouverner les données d’une entreprise prend vraiment tout son sens si cette gouvernance concerne aussi les données non-structurées comme les documents numériques, les médias, la messagerie... »
Même son de cloche chez Ecosys Group, cabinet de conseil en innovation, transformation digitale et data management dans les secteurs de l’énergie, de la mobilité et de la défense notamment : « Globalement les grands principes sont connus et en cours de mise en œuvre, confirme Héloïse Gilles, chef de projet senior. Un des grands chantiers est l’acculturation et la sensibilisation. Certains industriels veulent encore avant tout protéger leurs données, qu’ils considèrent comme sensibles, quand d’autres, comme les banques, qui gèrent justement des données sensibles, sont plutôt en avance. Il faudra bien deux ou trois ans pour que les socles de gouvernance se généralisent et que la valeur d’un partage en sécurité de la donnée soit prouvée. »
Le risque du SI en spaghetti
Tant que l’entreprise a une taille humaine, que les gens se rencontrent, que chacun sait qui fait quoi donc à qui demander telle ou telle information, la maîtrise du flux de données n’apparaît souvent pas comme une préoccupation. Jusqu’au jour où cela devient un problème, une source d’inefficacité. « On a commencé à se poser la question de la gouvernance de nos données il y a environ deux ans, raconte Anne-Claire Baschet, Chief Data Officer (CDO, directeur des données en français) d’Aramis Auto depuis juillet 2019, un réseau d’agences de vente de voitures créé en 2001. Avant cela, ce n’était pas le sujet ! L’entreprise, qui compte aujourd’hui 120 personnes au siège et 450 personnes au total, se développait en mode start-up et peu importait le prix à payer en interne pour gérer les données. On faisait face ! »
Mais ce mode de fonctionnement atteint vite ses limites : « Le risque est que le système d’information (SI) souffre du syndrome du « SI en spaghetti », reprend Anne-Claire Baschet. La circulation des données devient alors très tortueuse et compliquée, certaines données sont en doublon, d’autres interdépendantes… » Pour éviter ce sac de spaghettis et instaurer une gouvernance, Stéphane Roux, Chief Operating Officer chez ATOS identifie deux axes principaux : « Bien sûr, un gros travail sur la qualité des données. Mais l’autre moitié du boulot concerne le data lineage : la cartographie qui permet de visualiser le cycle de vie des données pour en gérer les flux. » Le sujet est d’actualité : pour preuve, des centaines de CDO ont été nommés ces dernières années. Et selon Gartner, 90 % des grandes entreprises en auront un d’ici à fin 2019. Pour quelques entreprises, ce sont des besoins de normalisation internes ou de croissance qui motivent la mise en place d’une gouvernance des données. Mais pour beaucoup, les éléments déclencheurs sont des contraintes : les contraintes réglementaires (notamment la RGPD en Europe, la réglementation sur les données personnelles), l’open data ou l’ouverture à la concurrence.
Barbant mais nécessaire
Pourquoi cette promesse d’efficacité se fait-elle souvent sous la contrainte ? Probablement parce que c’est difficile de motiver les troupes sur ces sujets plutôt rébarbatifs : « La gouvernance de la donnée est une question d’hygiène quotidienne et d’amélioration continue, résume Anne-Claire Baschet. Il faut regarder toutes les informations dont on dispose, nettoyer, trier, ranger, supprimer ce qui est inutile… et recommencer. » Ce qui est d’autant plus complexe et chronophage quand l’entreprise compte des milliers de salariés. « Nous avons initié la démarche en 2015, raconte Stéphane De Paris, CDO de SNCF Réseau, entité souvent citée en exemple pour sa data gouvernance [voir prochain article de ce dossier, NDLR]. Il nous a fallu du temps pour convaincre les métiers de l’intérêt de la démarche. C’était d’autant plus difficile que cela impacte surtout le SI, encore peu la production. »
« On n’est pas accueillis à bras ouverts, confirme François Herlent, responsable de la gouvernance de la data à la MAIF. Le sujet barbe un peu ! Les salariés comprennent l’intérêt de la gouvernance lorsqu’ils ont du mal à trouver des données. » Pourtant la MAIF, a aussi pris le sujet en considération de longue date, dès 2014. « On voyait arriver la RGPD (réglementation générale sur la protection des données) mais aussi Solvabilité 2, une réglementation européenne qui nous oblige à avoir une bonne traçabilité de nos indicateurs pour prouver qu’en tant qu’organisme financier, on a bien les capacités de payer les sinistres, raconte Hugues Roumezin, responsable Qualité des Données. Pour sensibiliser en interne, c’est l’approche risque que l’on a d’abord choisie. Maintenant que cette étape est franchie, on cherche désormais à valoriser le capital data en relayant le message « make other successfull » dans l’idée de rendre service au collectif en renseignant notre « dictionnaire de données ». On voudrait que lors du lancement d’un nouveau projet, chacun se pose la question des données à récupérer, y compris pour un usage ultérieur. Il y a encore beaucoup à faire dans cette acculturation à la donnée, condition pour que l’entreprise soit réellement data driven. »
Vers le data driven et la valorisation
La gouvernance des données s’impose également parfois en raison de changements d’organisation des entreprises ou d’ouverture à la concurrence, comme ce fut le cas dans le domaine de l’énergie et comme ça le sera très bientôt dans le secteur ferroviaire. « La SNCF est à l’aube d’un grand bouleversement, explique Stéphane Robin, CDO de SNCF Mobilités en charge du partage des données. Au 1erjanvier 2020, l’entreprise sera scindée en quatre sociétés anonymes (SA) et une holding. Ces quatre entités devront se transmettre des données de SA à SA alors que jusque-là, elles les partageaient dans une société commune ; le tout dans un nouveau cadre légal, qui évolue aussi avec plusieurs lois et décrets récents sur les données personnelles (RGPD), l’open data, l’ouverture à la concurrence ou le secret des affaires. Nous n’avons pas le choix ! Par exemple pour faire rouler un train, il faudra que le gestionnaire des infrastructures (SNCF Réseau) et les transporteurs (SNCF Voyageurs, les opérateurs privés de fret ou de transport de voyageurs) partagent des informations dans un cadre réglementaire et contractuel strict pour garantir la neutralité du gestionnaire vis-à-vis des différents opérateurs. Ce partage des data passera par une gouvernance des données, celle-ci doit être fonctionnelle rapidement ! »
Il ne faut néanmoins pas perdre de vue qu’au-delà de l’obligation, la maîtrise de la circulation des données est une opportunité pour générer de la valeur. C’est l’occasion de mettre en place un partage effectif de données de qualité dans toute l’entreprise, voire au-delà, avec ses partenaires en « shared data », et même en open data pour tout acteur externe (start-up, universitaires, collectivités territoriales, etc.). « En mettant en place notre gouvernance de données, on a pris conscience que nos data sont notre véritable levier d’efficacité et de différenciation par rapport à l’expérience de nos clients, reconnaît Anne-Claire Baschet, d’Aramis Auto. Nos données ont une valeur autant que notre applicatif métier. Et celles d’un métier A peuvent être utilisées par un métier B. » Une constatation valable pour toutes les organisations : les données ne doivent pas être rangées dans des silos mais pouvoir circuler. Or ces silos étaient la règle jusque-là. « Désiloter », ou plutôt créer des ponts entre les silos, car ces derniers sont nécessaires pour l’entreprise est un des mantras des CDO et cabinets de conseil en data management comme 3org, Ecosys Group, ATOS Consulting, Pramana, Quantmetry ou Talend.
Des impacts encore difficiles à évaluer
« Pour toutes les entreprises, la grande difficulté est d’avoir une vue globale de ses silos et de penser sa gouvernance en fonction de cela et de son domaine d’expertise, » fait remarquer Jean-Pascal Perrein de 3org. « Nos experts métiers ne se parlaient pas assez entre eux, ni avec les experts data, confirme François Herlent, à la gouvernance data de la MAIF. En améliorant la qualité de nos données, en désilotant, nous améliorons notre productivité et notre efficacité même si les retombées sont difficiles à chiffrer. Ce sont des erreurs évitées, des plus-values générées en valorisant mieux les informations sur nos clients, des campagnes téléphoniques mieux ciblées. » Chez Aramis Auto, plus que le gain, c’est le temps perdu par les data analysts et les data scientists pour retraiter les données, hésiter entre plusieurs informations, se reposer les mêmes questions… qui a été évalué à 15 %, surtout quand les équipes tournent vite.
Les gains sont d’autant plus difficiles à évaluer que dans un premier temps, la mise en qualité prend beaucoup de temps. « Il faut néanmoins que ce soit rentable, justifie Hugues Roumezin de la MAIF : 10 % de numéros de téléphone incorrectement renseignés n’est pas forcément problématique, mais le savoir est important pour éviter de les appeler. De même, nous veillons à éviter de dupliquer des données lors de la création de nouveaux contrats et nous nous posons la question de corriger des données sur des vieux contrats de plus de 40 ans. » Anne-Claire Baschet pointe un autre écueil auquel on ne pense a priori pas au premier abord : « En améliorant la qualité des données, on dégrade parfois un algo, on ne facilite donc pas forcément le travail des data scientists ! Car le modèle a été construit sur un certain type de données, éventuellement avec des algos de retraitement pour pallier leur manque de qualité ; le fait de l’améliorer peut avoir un effet positif comme négatif… »
© 3org
Pour aller plus loin
Qu’est-ce que la gouvernance des données et pourquoi en avez-vous besoin? (article de Talend )
Isabelle Bellin