Data science studio : définition

Environnement de développement, un studio de data science (data science studio en anglais) permet d'exploiter des ensembles de données à partir d'une architecture fondée sur l'apprentissage automatique (machine learning). Certains studios de data science comme Dataiku Data Science Studio permettent de faire du deep learning.

Qu'est-ce qu'un studio data science ?

Un studio data science est un outil d’intelligence artificielle permettant d’utiliser des données brutes collectées pour les transformer en des processus d’entreprises, parfois même en des applications Business déjà prêtes à être mises en production. Entre les deux, le studio de data science va nettoyer les données, les enrichir, les agréger, créer des modèles prédictifs, exporter des résultats, etc.

Quelles sont les fonctionnalités d'un studio de data science ?

Un studio de data science a de nombreuses fonctionnalités, notamment :

  • l’analyse prédictive ;
  • la gestion de stockage des données ;
  • la gestion d’outils de collaboration ;
  • la représentation graphique de données statistiques…

Cet outil peut être utilisé dans différents départements d’une même entreprise comme le marketing, la logistique, la R&D, les ventes, les ressources humaines, la Business Intelligence, le laboratoire des données… et dans de nombreux secteurs.

Quels sont les principaux studios de data science ?

Les principaux studios de data science sont :

  • Dataiku Data Science Studio ;
  • Data Robot ;
  • KNIME Analytics Platform ;
  • RapidMiner ;
  • SAS Open Model Manager ;
  • Google Data Studio.

Les créateurs de ces outils mettent tous en avant que leur studio de data science a été pensé pour pouvoir être aussi bien utilisé par les data analysts d’une entreprise que par des employés n’y connaissant rien en intelligence artificielle.

Dataiku

Entreprise française, Dataiku édite un studio de data science appelé Data Science Studio (DSS). Cet outil a pour spécificité de pouvoir traiter un très grand nombre de données brutes (Big Data).

DataRobot

DataRobot est une entreprise américaine fondée en 2012 qui a lancé la plateforme d'IA du même nom servant à créer et implémenter des applications prédictives à partir d’algorithmes spécialisés de machine learning.

KNIME

KNIME Analytics Platform est, comme son nom l'indique, une plateforme analytics qui a la particularité d’être un logiciel libre développé en open source. Son interface utilisateur est considérée comme très facile d’utilisation.

RapidMiner

RapidMiner est une plateforme de machine learning dite "tout-en-un", prenant en charge à la fois les procédures de data mining et l'analyse prédictive de données. Il s’agit également d’un outil open source disponible gratuitement.

SAS

SAS est l’un des leaders du marché de l'analytique avancée. Cette société propose différentes solutions de data mining comme SAS Visual Statistics, SAS Open Model Manager, SAS Scoring Accelerator. Les solutions SAS sont particulièrement recommandées pour les entreprises faisant de la Big Data.