DataOps : le DevOps appliqué à la data

Avec l'essor de l'apprentissage automatisé (Machine Learning ou ML) et de l'intelligence artificielle (IA), les données sont générées en masse. Collectées ensuite par les entreprises, elles ne sont pas toujours maîtrisées. La démarche DataOps vise à gérer ces données avec efficience. Des plateformes et des outils dédiés permettent de mettre en œuvre cette méthodologie. Les pratiques associées sont au cœur du métier de l'ingénieur DataOps.

Le DataOps, qu'est-ce que c'est ?

Le DataOps (Data Operations) optimise le cycle de vie des projets Data (relatifs aux données) et des analyses qui en sont issues. Selon le Gartner, il s’agit d’une pratique de gestion des données collaborative qui a pour but de favoriser l’exploitation de l’analytique dans les entreprises.

Quels sont les bénéfices du DataOps ?

Le DataOps tend à accroître la rapidité et l’efficacité dans le traitement des données, afin qu’elles soient analysables et exploitables par les entreprises. Une meilleure productivité des équipes informatiques et une réduction des risques commerciaux constituent les principaux atouts de cette méthodologie.

Que recommande le DataOps Manifesto for agile ?

Ce document référent en matière de méthodologie DataOps liste au total 18 principes. Ceux-ci comprennent notamment : la satisfaction continue du client, la valorisation des analyses de travail, l’acceptation du changement, la pluralité des rôles et des compétences dans les équipes (une diversité d’opinions encourageant l’innovation et la productivité), l’auto-organisation…

Le manifeste reprend les principales caractéristiques de la méthode agile, appliquées plus spécifiquement à l’approche du DataOps.

Quels sont les principaux outils et plateformes de DataOps ?

Des éditeurs proposent des outils et des plateformes qui supportent cette méthodologie afin de faciliter sa mise en œuvre au sein des équipes. Ces solutions ont pour principal objectif la gestion du cycle de vie d’un projet Data, de sa création à sa mise en production. Saagie, IBM et Datalytyx, par exemple, ont créé des solutions complètes pour intégrer ces pratiques.

DataOps ingénieur : quel profil de compétences, salaire et formation ?

L’ingénieur DataOps doit avoir un bac + 5 en informatique orientée Big Data (cursus universitaire en plein développement), ou être titulaire d’un diplôme d’ingénieur spécialisé dans la Data. Il pilote le pipeline d’analyse de données en production, et vérifie la disponibilité et la performance des systèmes. Selon sa formation et son expérience, le salaire d’un ingénieur DataOps oscille entre 50 et 80 KE par an.

DataOps vs DevOps

Le DataOps intègre la base de données dans les tests, il s’agit de DevOps appliqué aux données afin de répondre à un besoin plus précis. Les deux démarches sont collaboratives et impliquent plusieurs métiers, le DataOps étant spécifiquement orienté vers les entreprises tournées vers la Data.

DataOps vs MLOps

D’un point de vue méthodologique, on retrouve les mêmes approches adaptées à des domaines différents, bien que liés. Le DataOps participe au déploiement, à l’analyse et au monitoring des données (Data), tandis que le MLOps est orienté vers la création, le déploiement et le monitoring des modèles d’apprentissage automatique (Machine Learning).

Dictionnaire du big data