DataRobot : tout savoir sur la plateforme d'IA no code

DataRobot : tout savoir sur la plateforme d'IA no code Plateforme d'intelligence artificielle automation, DataRobot fait du machine learning automatisé sa marque de fabrique, mais intègre également le MLOps.

DataRobot, c'est quoi ?

Fondé en 2012 aux Etats-Unis, DataRobot est l'un des pionniers du machine learning automatisé (auto ML). En fonction d'un problème à résoudre (une prédiction financière, une maintenance préventive, de la reconnaissance d'images...), sa brique d'auto ML sélectionne et entraîne plusieurs algorithmes possibles, avant de les scorer en mixant plusieurs combinaisons d'hyperparamètres, pour ne retenir au final que le modèle le plus performant. Lancée en 2021, AI App Builder est un environnement de développement no code qui vient coiffer la plateforme. 

DataRobot est l'un des seuls à avancer une alternative crédible à l'offre cloud d'autoML de Google, qui est historiquement considérée comme la référence du domaine. Sur le modèle de Google, l'entreprise s'est étendue pour couvrir tout le cycle de vie du machine learning, de la préparation des data sets d'apprentissage au déploiement des modèles en passant par leur entrainement. En juillet 2021, DataRobot a bouclé un tour de table de série G de 300 millions de dollars, hissant sa valorisation à 6,3 milliards de dollars. L'opération porte à 1 milliard de dollars le total des fonds levées par la société du Massachusetts. Comptant plus de 1500 salariés, DataRobot n'hésite à présenter ce dernier tour de table comme "une levée de fonds pré-IPO". 

Pourquoi utiliser DataRobot ?

Le point fort de la plateforme de DataRobot réside dans sa facilité de prise en main, y compris pour des analystes data ou experts business. Et ce pour créer comme mettre en production des modèles. Quant aux data scientists, l'offre leur permettra d'accélérer leurs développements.

Autre point fort revendiqué par la société : l'orchestration d'un workflow de gouvernance de la conception à la mise en œuvre des modèles. Issue du rachat de ParallelM en février 2019, cette solution de MLOps a depuis été renforcée pour supporter les modèles développés à la main en Python ou R. 

DataRobot permet de modéliser des pipelines d'apprentissage. © JDN / Capture

Qui utilise DataRobot ?

DataRobot affiche une base de plusieurs centaines de clients qui reflète la courbe d'adoption de l'IA par secteur. Ses clients se recrutent principalement dans les services financiers, le retail, le manufacturing ou encore la santé. En France, DataRobot revendique Carrefour et Cdiscount parmi ses principales références. L'éditeur a également signé avec plusieurs ESN hexagonales, dont Axians (filiale de Vinci), ASI et Mydral. Comptant une dizaine de personnes, son bureau parisien regroupe commerciaux, consultants et data scientists.

Quelles sont les fonctionnalités de DataRobot ?

Parmi les principales fonctionnalités de la plateforme de DataRobot figurent :

En matière de MLOps, DataRobot comprend des outils pour monitorer la performance des modèles (en matière de précision, de dérive, de biais...), pour les déployer, et pour les gérer en production (gestion de version, automatisation des réentrainements via Continuous AI...). DataRobot intègre également la notion de gouvernance. Sur ce plan, la plateforme est équipée d'un référentiel centralisé des modèles, d'un moteur de gestion de workflows d'approbation ou encore de tableaux de bord de mise en conformité. Côté feature store, DataRobot met en avant son intégration à Snowflake. 

DataRobot permet de traquer les dérives des modèles de deep learning. © JDN / Capture

DataRobot est-il conçu pour les data scientists développeurs ?

Historiquement, DataRobot cherche à automatiser le codage des modèles de machine learning. Ce qui le rendait peu attractif pour les data scientists avancés cherchant à accéder aux sources des algorithmes. Un point faible que le cabinet d'étude américain Gartner lui a longtemps reproché.

Pour combler cette faiblesse, DataRobot a mis au point un environnement pour faciliter le développement de modèles ad hoc en recourant aux principales bibliothèques de machine learning (Scikit-learn, TensorFlow, PyTorch…). Baptisé DataRobot Core, il permet de gérer des notebooks supportant Python, R, Scala, Spark ou encore SQL.

Quel est le prix de DataRobot ?

DataRobot propose une période d'essai gratuite pour se familiariser avec ses différents outils. Sur la marketplace d'AWS, la plateforme affiche un prix public de 65 000 dollars par an dans la limite de cinq utilisateurs métier et cinq modèles déployés.

Comment déployer DataRobot ?

Déployable sur site (on-premise), DataRobot est aussi disponible sous forme d'un service cloud managé. Baptisé DataRobot Managed AI Cloud, ce dernier est hébergé sur AWS. En Europe, il est disponible sur la région cloud d'Amazon basée en Irlande. 

DataRobot est par ailleurs optimisé pour les déploiements sur Microsoft Azure et Google Cloud. La plateforme est par ailleurs dotée d'un outil baptisé Portable Prediction Servers pour packager les modèles sous forme de containers et d'infrastructure Kubernetes en vue de les porter sur le cloud ou système IT de son choix. 

DataRobot vs Dataiku : quelles différence ?

Au même titre que DataRobot, Dataiku est également une plateforme dédiée à la création de modèle de machine learning. A la différence de DataRobot, cette dernière se présente historiquement sous la forme d'un studio de data science orienté vers les développeurs. Elle a néanmoins rejoint le positionnement de DataRobot en intégrant elle-aussi des possibilités d'auto ML. 

Face à DataRobot, Dataiku se distingue sur le front de la collaboration. L'éditeur multiplie les fonctionnalités dans ce domaine : wiki, partage de tableaux de bord de résultats, système de gestion des rôles et de traçabilité des actions, etc.

DataRobot : tutoriels et documentation

Afin de mieux appréhender toutes les possibilités de DataRobot, l'éditeur du même nom propose différents tutoriels. La formation et la documentation passent par un espace communautaire, un guide de démarrage, ainsi que des articles de blog.