Inférence en machine learning et deep learning : définition

L'inférence est une opération logique basée sur l'induction. L'inférence en machine learning et deep learning (respectivement apprentissage automatisé et apprentissage profond) vise à faire des prédictions efficaces à partir d'un modèle entraîné. Explications.

L'inférence en machine learning, qu’est-ce que c'est ?

Dans le machine learning (apprentissage automatisé), la phase d’apprentissage consiste à concevoir et entraîner un modèle à partir de données existantes (jeu de données ou dataset). Avec pour but de l’amener progressivement à établir des relations entre des caractéristiques et des étiquettes.

Précisément, qu’est-ce qu’une caractéristique en ML (machine learning) ? Une caractéristique est une variable d’entrée. Concrètement, il peut s’agit de l’âge d’un individu, son âge, sa taille, son poids… Dans le cas de projets de machine learning de grande envergure, il peut y avoir des millions de caractéristiques.

Une étiquette est quant à elle le résultat d’une prédiction : il peut s’agir de l’évolution du cours d’un titre boursier, d’une catégorie d’objet représentée sur une image, etc. Avant d’apprendre par lui-même (principe même de l’apprentissage automatisé), le modèle de machine learning va être entraîné à partir d’exemples étiquetés. Il va ainsi apprendre, à partir d’un jeu de données existant. Un exemple est une instance de donnée particulière.

Un exemple avec étiquette comporte une (au minimum) ou plusieurs caractéristiques. Le modèle une fois entraîné va être confronté à des exemples sans étiquettes. En pratique, le modèle entraîné sera ainsi en capacité de réaliser des prédictions et de déterminer par lui-même ces étiquettes. C’est ce processus que l’on nomme inférence.

En quoi consiste l'inférence en machine learning simple ?

Les projets de machine learning simple vont utiliser peu de caractéristiques, au minimum une. Par exemple, dans le cas d’un filtre antispam, les caractéristiques peuvent regrouper ces éléments :

  • adresse mail de l’expéditeur ;
  • mots spécifiques dans le corps du mail ;
  • l’heure d’envoi du mail.

L’inférence est le raisonnement auto-entraîné qui va ensuite permettre de déterminer qu’un certain type de mails reçus appartient effectivement à la catégorie "spam".

En quoi consiste l'inférence en deep learning ?

Le deep learning (apprentissage profond) est une méthode d’apprentissage automatisé en machine learning. On apprend aussi à ce modèle à catégoriser des données à partir d’un jeu d’apprentissage comprenant des exemples avec étiquettes. Le deep learning est fondé sur un système de réseaux de neurones artificiels : plusieurs modules s’enchaînent, et les sorties des uns fournissent les entrées des autres.

Le deep learning permet une très grande puissance de calcul, ce qui autorise le traitement d’un volume très important de données, donc d’exemples et de caractéristiques nombreux. L’inférence consiste ici à rendre le modèle entraîné autonome et à lui permettre d’identifier, de traiter et d’analyser seul des résultats à partir d’exemples complexes possédant un grand nombre de caractéristiques.

Dictionnaire de l'intelligence artificielle