Data management platform : la plateforme big data par excellence

Par définition, une data management platform tire bénéfice des atouts du cloud pour traiter et analyser un volume massif de données. Elle peut servir, par exemple, à effectuer des tâches d'analyse prédictive. Il existe différents outils dont certains open source.

Une data management platform (DMP), c'est quoi ?

Une data management platform (DMP) est une plateforme nativement cloud qui permet de traiter un très grand volume de données, structurées ou non structurées, en tirant parti de la puissance de calcul et de l'élasticité du nuage. Le concept de DMP constitue l'évolution naturelle de l'entrepôt de données (data warehouse) et du lac de données (data lake) à l'heure du cloud, du big data et de l'intelligence artificielle. Une data management platform couvre tout le cycle de vie de la donnée, de la collecte à la valorisation en passant par l'acquisition, la transformation et le stockage, tout en donnant à accès à des outils de business intelligence (BI) et de machine learning. Une DMP permet, par exemple, de faire de l'analyse prédictive pour cerner les tendances d'un marché ou prédire le comportement des consommateurs. Elle s'adresse aussi bien à des experts de la BI qu'à des spécialistes de la data science.

Quelles sont les fonctionnalités d'une data management platform ?

Une data management platform (DMP) ne se limite pas à être un data warehouse dans le cloud. Elle intègre tous les composants nécessaires à l'ingestion, la transformation, la qualification, la préparation, la découverte et la datavisualisation des données. Grâce à ses connecteurs, la plateforme peut se brancher à un grand nombre de sources de données. Elle offre aussi l'accès à différentes bibliothèques de machine learning à des fins d'analytique.

Quelles sont les solutions de data management platform ?

Sur ce marché de la data management platform, on distingue les offres des cloud providers - Amazon Redshift pour AWS, Azure Synapse pour Microsoft et BigQuery pour Google Cloud – des solutions agnostiques à une plateforme telles que Snowflake ou Databricks.

Les data management platform open source

Des entrepôts de données open source orientés big data comme MongoDB ou MariaDB se positionnent comme de potentielles data management platform.

Qu'est-ce qu'une master data management platform ?

Le master data management (MDM), ou gestion des données de référence (GDR), correspond à un ensemble d’outils et de méthodes visant à centraliser les données critiques de l'entreprise au sein d'un référentiel unique.

Dictionnaire du big data