Data science : définition, disciplines et compétences

Data science : définition, disciplines et compétences [DATASCIENCE] La data science présente de nombreuses possibilités d'applications, notamment dans l'analyse statistique et décisionnelle, et dans le machine learning et l'intelligence artificielle.

La data science, c’est quoi ?

La data science, ou science de la donnée en français, renvoie à l’exploitation d’ensembles de données pour en tirer de la valeur. Elle passe par l'utilisation d’algorithmes et autres techniques scientifiques d'analyse et de traitement, mais aussi par le recours à des outils pour les mettre œuvre au premier rang desquels les studios de data science.

Pourquoi la data science ?

La data science permet de générer des connaissances à partir de l'exploration et l'analyse d'ensembles de données. Historiquement, elle est utilisée dans l'analyse décisionnelle ou business intelligence. Plus récemment, elle est aussi utilisée dans le big data pour traiter des volumes massifs de données, mais aussi en IA pour créer des modèles d'apprentissage (ou machine learning).

Quels sont les principaux domaines de la data science ?

La data science est une approche pluridisciplinaire visant à exploiter des données. Elle implique de nombreux domaines d’expertise. Par exemple, les mathématiques appliquées, les statistiques, l’informatique, la data engineering, ainsi que le machine learning et plus largement l'intelligence artificielle. Elle emploie ainsi différentes méthodes liées aux technologies de l’information :

  • Le stockage de données,
  • La visualisation de données,
  • Les modèles statistiques et de probabilité,
  • L'apprentissage automatique,
  • La programmation de logiciels et d’utilitaires…

Les domaines d’application de la data science sont innombrables. Néanmoins, elle est surtout utilisée dans les secteurs suivants : l’aéronautique, l’économétrie, les télécommunications, l’e-commerce, les médias et la santé publique. Il s’agit là d’une liste non exhaustive.

Qu'est-ce que le métier de data scientist ?

Le data scientist a pour mission de faire parler les données dans le but d'améliorer l'efficacité de l'organisation. Ses principales missions sont les suivantes : 

  • Identifier les solutions d'analyse,
  • Recueillir et analyser les données pertinentes pour l'entreprise,
  • Créer des tableaux de bord de pilotage,
  • Bâtir des algorithmes pour créer des modèles de prédiction ou pour automatiser des processus opérationnels.

En tant qu'expert et responsable de la data science au sein d'une entreprise, on peut lui confier de nombreux projets :

  • L’analyse des tendances de marché,
  • La prévision des ventes,
  • Le ciblage de campagne publicitaire,
  • La maintenance prédictive industrielle…

On peut aussi évoquer l’amélioration des systèmes de transport urbain, la maintenance préventive dans l'industrie, la fidélisation client...

Quel est le profil de compétences attendu d’un data scientist ?

Un data scientist maîtrise de nombreux domaines d’expertises liés à la data science, au premier rang desquels les mathématiques appliquées, les statistiques, le machine learning ou encore la gestion des risques.

Un data scientist doit faire preuve de polyvalence et d’adaptabilité. Il doit aussi faire montre d'une aisance relationnelle pour collaborer avec différents acteurs de l’entreprise, des chefs de projets aux directeurs métier.

Dictionnaire de l'intelligence artificielle