Data gouvernance : comment déployer une gouvernance des données ?

Data gouvernance : comment déployer une gouvernance des données ? Par définition, la data gouvernance réunit l'ensemble des règles et des processus gérant, par exemple, le cycle de vie de la donnée. Elle repose sur un framework, différents outils voire une plateforme dédiée.

La data gouvernance, c'est quoi ?

La data gouvernance désigne l’ensemble des règles et processus gérant l'ensemble du cycle de vie de la donnée, de sa collecte à son traitement en passant par toutes les étapes de qualification. En d'autres termes, elle consiste à s'assurer que l'exploitation de la data est réalisée en conformité avec les règles et l'organisation préalablement établies.

Une bonne gouvernance permet à une entreprise de tirer tout le potentiel de son patrimoine informationnel tout en assurant la sécurité des données et leur conformité au cadre règlementaire, à commencer par le RGPD. Elle repose sur un cadre méthodologique, des hommes clés et des solutions technologiques.

Pourquoi une gouvernance des données ?

Une data gouvernance permet de s'assurer en amont de leur exploitation que les données sont fiables, à jour, au bon format, sécurisées et conformes à la réglementation en vigueur. Elle définit ensuite qui est propriétaire de la donnée, qui peut l'utiliser et sous quelles conditions.

La mise en place d’un cadre de gouvernance de la donnée permet, par ailleurs, de valoriser les actifs d'une entreprise, avec des données parfois dormantes ou silotées. En renforçant ses capacités d'analyse, une organisation optimise ses processus opérationnels et enrichit sa vision du marché.

Comment mettre en place une gouvernance des données ?

Une data gouvernance suit des étapes clés :

  1. Dresser un inventaire des données existantes (data catalog),
  2. Définir un vocabulaire commun (glossaire métier),
  3. Initier une démarche de qualité de la donnée,
  4. Formaliser et documenter des processus de traitement.

Qui est responsable de la gouvernance des données ?

Le chief data officer (CIO) est le responsable de la gouvernance de la donnée. Il est en charge de son pilotage au niveau de l'ensemble de l'entreprise. Dans son équipe, il fédérera des propriétaires des données (data owners), des gestionnaires de données (data stewards) et des gardiens des données (data custodians) en charge de la maintenance des sources de données.

Qu'est-ce qu'un data gouvernance framework ?

Un data gouvernance framework consigne l'ensemble des règles et des processus du cadre de gouvernance mais aussi les rôles et les responsabilités des acteurs clés.

Quels sont les outils de data gouvernance ?

La data gouvernance fait appel à un certain nombre d'outils pour qualifier les données, suivre leur cycle de vie (data lineage), gérer les métadonnées, créer un glossaire métier ou un dictionnaire des données, rendre les données accessibles aux utilisateurs finaux (moteur de recherche), documenter les process. Des éditeurs comme IBM, Talend, Alteryx, Cloudera ou SAS proposent des plateformes dédiées à la gouvernance des données.

Dictionnaire du big data