MLOps : le mariage du data scientist (ML) et de l'administrateur informatique (Ops)

Le MLOps, abréviation de " Machine Learning Operations " (opérations d'apprentissage automatique en français), est un ensemble d'outils relevant du domaine de l'IA (intelligence artificielle).

L’objectif du MLOps est d’améliorer le cycle de vie des projets de datascience ou de produits/services basés sur l’exploitation de données (Big Data). L’ingénieur MLOPs en est le protagoniste. Cette profession émergente est le produit du métissage entre le data scientist (spécialiste de la science des données) et l’administrateur informatique.

Le MLOps, qu'est-ce que c'est ?

Le MLOps peut être vu comme l’adaptation des méthodes agiles au monde de la donnée, ou Big Data. Ces pratiques agiles permettent de concevoir des outils (MLOps) pour faciliter et automatiser les nouveaux tests avant la mise en production effective.

Quels sont les bénéfices du MLOps ?

Les outils MLOps participent à la hausse de la productivité des entreprises en rendant exploitables un maximum de projets. Le MLOps permet en effet une optimisation de la mise en production, avec pour objectif une translation efficace du mode concept au projet réel (POC = proof of concept).

Quels sont les principaux outils de MLOps ? (DataRobot…)

Parmi les outils majeurs de MLOps, on peut citer :

  • DataRobot, outil qui permet au data scientist d’automatiser le processus de test des modèles d’apprentissage automatique.
  • La plateforme Algorithmia, qui vise à déployer et gérer des modèles d’apprentissage automatique, quel que soit le framework ou le langage utilisé.
  • Kubeflow, plateforme open source propulsée par Google pour exécuter TensorFlow (outil d’apprentissage automatique développé aussi par Google).
  • MLflow, qui facilite l’automatisation du suivi de modèles sophistiqués pour les professionnels de la donnée.

Quels sont les principaux services cloud de MLOps disponibles sur AWS, Azure et Google Cloud ?

L’AWS CloudFormation proposé par Amazon est la solution cloud qui permet la modélisation et la gestion d’une collection de ressources (AWS et autres) dans toutes les étapes de leur cycle de vie. Le service cloud Azure Machine Learning de Microsoft permet le stockage, la gestion et le déploiement des modèles de Machine Learning au sein d’un espace de travail dédié. Google Cloud propose également des services cloud dédiés au MLOps. Le plus connu est le Cloud AutoML, qui permet la création et la gestion de modèles qualitatifs, même avec peu d’expérience en ML.

Comment se former au MLOps ?

Plusieurs modules de formation sont proposés en ligne et dans les facultés de sciences ou les écoles d’ingénieur. L’ingénieur MLOps est avant tout un spécialiste de la donnée (une formation de data scientist est le sésame pour entrer dans la profession). Il doit maîtriser en outre les règles de la programmation et l’ingénierie logicielle.

MLOps vs DevOps

Le DevOps, contraction en anglais de Developement (Dev) et Operations (Ops), combine deux fonctions essentielles de la DSI : le développement d’application et l’ingénierie système. Les MLOps découlent des DevOps, ils répondent plus spécifiquement aux problématiques du Machine Learning (ML).

DevOps