Data gouvernance : comment déployer une gouvernance des données ?

Par définition, la data gouvernance réunit l'ensemble des règles et des processus gérant, par exemple, le cycle de vie de la donnée. Elle repose sur un framework, différents outils voire une plateforme dédiée.

La data gouvernance, c'est quoi ?

La data gouvernance désigne un l’ensemble des règles et des processus gérant tout le cycle de vie de la donnée, de sa collecte à son traitement en passant par toutes les étapes de qualification. Une bonne gouvernance permet à une organisation de tirer tout le potentiel de son patrimoine informationnel tout en assurant la sécurité des données et leur conformité au cadre règlementaire, à commencer par le RGPD. Elle repose sur un cadre méthodologique, des hommes clés et des solutions technologiques.

Pourquoi recourir à la gouvernance des données ?

Une data gouvernance permet de s'assurer en amont de leur exploitation que les données sont fiables, à jour, au bon format, sécurisées et conformes à la réglementation en vigueur. Elle définit ensuite qui est propriétaire de la donnée, qui peut l'utiliser et sous quelles conditions. La mise en place d’un cadre de gouvernance permet, par ailleurs, de valoriser les actifs d'une entreprise, avec des données parfois dormantes ou silotées. En renforçant ses capacités d'analyse, une organisation optimise ses processus opérationnels et enrichit sa vision du marché.

Comment mettre en place une gouvernance des données ?

Une data gouvernance suit des étapes clés comme dresser un inventaire des données existantes (data catalog), définir un vocabulaire commun (glossaire métier) ou initier une démarche de qualité de la donnée. Il s'agit ensuite de désigner un responsable de la data (Chief data officer), des propriétaires des données (data owners), des gestionnaires de données (data stewards) et des gardiens des données (data custodians), en charge de la maintenance des sources de données.

Qu'est-ce qu'un data gouvernance framework ?

Un data gouvernance framework consigne l'ensemble des règles et des processus du cadre de gouvernance mais aussi les rôles et les responsabilités des acteurs clés.

Quels sont les outils de data gouvernance ?

La data gouvernance fait appel à un certain nombre d'outils pour qualifier les données, suivre leur cycle de vie (data lineage), gérer les métadonnées, créer un glossaire métier ou un dictionnaire des données, rendre les données accessibles aux utilisateurs finaux (moteur de recherche), documenter les process. Des éditeurs comme IBM, Talend, Alteryx, Cloudera ou SAS proposent des plateformes dédiées à la gouvernance des données.

Dictionnaire du big data