Data gouvernance : les conditions du succès
⏱ 7 minMaîtriser les données d’une entreprise est avant tout une aventure humaine. La démarche doit être soutenue au plus haut niveau, de nouvelles missions et de nouvelles instances de gestion doivent être inventées. Alors seulement, la cartographie des données peut être organisée, avec des règles de gestion partagées.
Une petite équipe suffit pour se lancer dans le vaste chantier de la gouvernance des données. « Nous sommes 3 et demi, précise François Herlent, responsable de la gouvernance de la data à la MAIF, dont un prestataire qui nous accompagne dans la maîtrise d’ouvrage et un étudiant en master, en alternance. » Mais ne nous y trompons pas ! Le soutien et même le sponsoring de la démarche doit être impulsé au plus haut niveau de l’entreprise. La gouvernance des données doit être au service d’une stratégie data pensée en amont. « Après deux années pour structurer notre démarche, accompagnés au début par le cabinet 3org du point de vue conceptuel, on a eu carte blanche en 2016 pour installer l’animation de la gouvernance des données, données personnelles en priorité, poursuit François Herlent. Nous avons fédéré les acteurs en collectifs, en comités car quel que soit les outils de gestion de données, ce sont les personnes qui l’alimentent qui comptent. »
Définir une stratégie data
« La gouvernance doit répondre à une stratégie data portée au plus haut niveau avec des enjeux de valorisation, insistent Héloïse Gilles et Aude Beuter d’Ecosys Group, cabinet de conseil en innovation et data management. Elle repose sur des principes d’utilisation des données et sur un comité qui anime les activités liées à la gestion de la data dans les métiers et fait respecter les règles et processus définis. » Schneider Electric, SNCF Réseau ou la MAIF sont quelques exemples vertueux en la matière. Le cabinet Quantmetry, qui accompagne la transformation data de grands groupes français, identifie 4 leviers pour mettre en place une gouvernance de la donnée :
– définir les nouveaux rôles associés à la gouvernance côté métiers et côté UT ainsi que les comités de gouvernance ;
– définir les règles partagées et consensuelles tout au long du cycle de vie de la donnée (niveau de confidentialité, de sécurité, qualité, propriété, indicateurs de performance…) ;
– définir les bons processus d’accès aux données, de contrôle des règles, de gestion des référentiels de données ;
– sélectionner les bons outils pour la collecte, la documentation, l’utilisation, la traçabilité des données.
« Il ne faut pas vouloir aller trop vite, tempère Stéphane Robin, Chief Data officer (CDO) de SNCF Mobilités en charge du partage des données, qui initie la démarche depuis quelques mois dans le cadre particulièrement complexe de la restructuration de la SNCF et de l’ouverture à la concurrence. Il y a un besoin de prise de conscience, de changements des mentalités, y compris au niveau des comités de direction. » Alors seulement, un langage commun peut être imaginé pour savoir quelles données prendre en compte, comment les décrire et définir les instances de gouvernance. « Nous avons fait un benchmark pour tirer parti de l’expérience de 10 entreprises des secteurs de l’énergie, du transport, de la banque, des télécoms et de la défense, c’est un bon moyen pour accélérer ces prises de conscience et engager l’entreprise dans les évolutions nécessaires pour partager les données. » « Nous avons décidé en interne trois niveaux de décision, détaille Stéphane Robin : une instance stratégique trimestrielle avec des représentants des activités de SNCF Mobilités, une instance opérationnelle mensuelle réunissant les CDO de SNCF Mobilités et une instance technique dédiée à des projets spécifiques. »
Instances et référents
À la MAIF, la gouvernance des données s’est bâtie autour d’un comité de coordination d’une dizaine de membres (au moins un de chaque direction) créé en 2014 et qui se réunit tous les mois et demi : c’est l’autorité transverse qui définit le cadre général et l’organisation détaillée de la gouvernance. Les chevilles ouvrières de cette organisation sont issues des métiers : ce sont les « référents de domaines fonctionnels », un rôle (et non une fonction) qui est attribué à certaines personnes pour chaque activité de la mutuelle qui manie des données personnelles (contrats, sinistres, etc.). « Ces référents sont très importants, explique François Herlent : ce ne sont pas des spécialistes data mais bien des professionnels d’un domaine d’activité, ils savent d’où viennent les données de leur domaine, quel est le niveau de qualité nécessaire aux différents usages, quelle est la durée de conservation, quel est le niveau de confidentialité, etc. Ils suivent également la qualité des données avec des indicateurs comme le pourcentage de numéros de téléphone, d’e-mail ou de dates de permis de conduire renseignés… Et dès qu’un nouveau projet émerge, ils s’assurent que les règles fixées sont bien respectées. »
Ces référents portent divers noms selon les entreprises comme correspondant, membre d’un comité inter-métiers, data owner, responsable de la donnée… « Les entreprises commencent à comprendre que l’usage des données et leur qualité sont subordonnés à l’identification des données puis à la connaissance des règles à leur appliquer. Cela nécessite une coordination des experts de la donnée dans l’entreprise, car ce sont ces derniers qui doivent déterminer la direction commune garante d’une bonne maîtrise des informations de l’entreprise, explique Jean-Pascal Perrein, CEO de 3org, cabinet de mentorat en gouvernance de l’information. En général, ce sont des opérationnels dans les directions métiers. Pour autant, même s’ils ont le savoir de l’usage de la donnée, ils ne peuvent être responsables des règles à lui appliquer. Plutôt que data clowneries, je préfère parler de « propriétaires délégués ». À mon sens, des rôles exécutifs doivent porter la responsabilité de « propriétaires de l’application des règles concernant les données », mais pas des données en elles-mêmes. » « La donnée n’appartient à personne, renchérit Héloïse Gilles d’Ecosys Group ; elle peut d’ailleurs être utile à plusieurs domaines d’activité. Nous préférons parler de responsable de la donnée. C’est un grand sujet de définir ces fonctions. Il faut identifier les bonnes personnes dans les métiers, les former et officialiser le temps consacré dans leur fiche de poste, avec des objectifs précis ajoutés à leurs objectifs annuels. »
Dans une PME comme Aramis Auto (120 personnes au siège), le principe est comparable avec un comité évidemment restreint. « Dans notre bord, nous sommes 5 : 4 issus de l’IUT et une personne côté métier, explique Anne-Claire Baschet, CDO de l’entreprise. Et un membre du comité exécutif participe si besoin. On travaille en mode Kaizen pour décrire un problème, par exemple le modèle de données des commandes : on décompose le processus vu du client en visualisant ensemble le flux des données sur un mur ou un tableau blanc, on analyse notre fonctionnement et comment l’améliorer étape par étape, de façon consensuelle. »
Une cartographie et des règles partagées
Parmi les étapes importantes, il y a la cartographie des données, une représentation très concrète des groupes de données de l’entreprise, avec son propre langage métier. « Selon l’entreprise, on peut l’organiser par process (finance..), produits (chaîne de valeur), client (approche customer centric) ou choisir de représenter des flux (dynamique de la data), précise Quantmetry. L’essentiel est de la construire avec les métiers et de coller à des perceptions partagées. » « Dans la pratique, aucune des entreprises avec lesquelles nous travaillons n’a pu finaliser son référentiel avec l’ensemble de ses informations et des règles associées, reconnaît Jean-Pascal Perrein. C’est difficile et long à mettre en place, car ces règles sont autant de facettes d’expertises portées chacune par une personne dans l’entreprise. La création de ponts entre ces personnes prend du temps. »
Ces règles, à appliquer sur chaque donnée, sont définies selon la politique de l’entreprise en matière de conservation, de sécurité, de qualité, de gestion des données personnelles, etc. ; et elles doivent être cohérentes entre elles avec tel ou tel niveau de confidentialité, telle ou telle durée de conservation, la suppression pour telle donnée ou au contraire la mise à disposition de partenaires pour une valorisation, etc. Toutes les données et leurs règles sont réunies dans un référentiel qui peut, là encore, avoir différentes dénominations selon l’entreprise. « À la MAIF, nous parlons d’un dictionnaire de données, précise François Herlent. On y trouve les données classées par domaines et la liste des tables qui les contiennent. On en est à 25% du référencement. »
Des outils en appui
Car, bien loin d’un Data Lake où seraient stockées des copies des données brutes, il s’agit de les organiser en gisements en modélisant les informations qu’elles contiennent avec des structures spécifiques, parfois des méta-modèles et des ontologies pour comprendre, interpréter et naviguer dans les données. De fait, un certain nombre d’outils de gestion, parfois en open source, sont utiles et nécessaires comme les outils de modélisation mais aussi des outils de profilage, d’analyse, de standardisation, d’amélioration, de nettoyage des données, de gestion des métadonnées, etc.
« Les outils de gouvernance, qui se sont multipliés il y a un peu moins de 10 ans, sont plus largement utilisés depuis 2014, estime Etienne Roux, Chief Operating Officer chez ATOS. Ils sont apparus avec l’explosion du big data, succédant aux outils BI des années 1990 puis MDMLe Master Data Management (MDM) permet à une entreprise de s’assurer qu’elle dispose en permanence d’une seule version de ses données, exacte et à jour, version parfois appelée « single version of the truth » ou « golden records ». Cette non redondance lui permet de prendre des décisions plus efficaces et d’assurer de façon adaptée leur traçabilité cohérente. depuis 2007. On est ainsi passé du data driven basé sur la maîtrise et la compréhension des données au data driven piloté par la donnée et scalable, capable d’intégrer de nouvelles données et de nouveaux formats. » Avec son équipe, ils accompagnent des entreprises pour choisir le bon écosystème d’outils : des outils de gouvernance pure (qui accède à quelle données ?), des MDM (pour appliquer les règles choisies), des outils d’administration des données comme Axon (Informatica) ou Collibra, des outils de data linkage (pour visualiser le flux de données)… « Les outils comme Axon, Collibra ou des MDM sont intéressants car leurs modèles de données sont adaptables à chaque entreprise (ils sont model driven). Mais les outils ne suffisent pas, les imposer ne rend pas data driven, reconnaît Etienne Roux. Il nous est arrivé de conseiller aux entreprises de commencer par passer par une étape d’audit de la qualité accompagné de conduite de changement. »
Des éditeurs d’autres secteurs avancent aussi leur solution comme Opendatasoft, qui travaille pour les smart cities et propose désormais un moteur de recherche de données adapté aux entreprises. « Des entreprises avec lesquelles nous travaillions sur les villes nous ont sollicités pour utiliser nos outils pour leurs propres problématiques, raconte Jean-Marc Lazard, fondateur et CEO d’Opendatasoft. De fait, notre solution collecte, prépare et met à disposition les données pour qu’elles soient partagées entre un ensemble d’acteurs aux modèles économiques et solutions techniques variées. Or, une grande entreprise rassemble souvent, elle aussi, à son échelle, une pluralité d’acteurs qui travaillent chacun dans son monde. La transformation digitale, c’est d’abord de faire fructifier un patrimoine de data qui coûte très cher à produire et à stocker ! Il faut que les données soient sur étagère, utilisables par tous en interne et en externe. » SNCF Réseau, GRDF, Schneider Electric, Saint-Gobain, Indigo (spécialiste du stationnement) ou Birdz, une des start-up de Nova Veolia (filiale de Veolia Eau qui développe des services numériques innovants) sont parmi ses clients.
« Mais les outils ne font pas de miracle, rappelle Jean-Pascal Perrein de 3org. Sachant que les éditeurs de solutions ne proposent pas encore d’outil offrant une gestion globale de la gouvernance des données, la faute à un marché compliqué faisant appel à de trop multiples prescripteurs …. Il faut mettre à profit un package d’outils, sinon on risque de créer de nouveaux silos. Cela dit, certains outils facilitent déjà beaucoup le travail, en étant auto-alimentés (avec les domaines, catégories, règles, métadonnées renseignées automatiquement). Et dans cinq à dix ans, des outils à base d’intelligence artificielle seront capables de faire de la gouvernance. »
Isabelle Bellin