Apprentissage supervisé : définition et exemples d'algorithme

Dans le domaine du machine learning, l'apprentissage supervisé consiste à ce qu'une IA (intelligence artificielle) assimile des règles et des fonctions de prédiction à partir d'exemples. Ces derniers forment une base où l'IA trouve les ressources pour appliquer des décisions pertinentes sans intervention humaine.

Quelle est la définition de l’apprentissage supervisé ?

Egalement connu sous le terme de supervised learning, l’apprentissage supervisé est une méthode pour permettre à une intelligence artificielle (IA) d’appliquer ses fonctions en toute autonomie. Les règles initiales s’agrémentent alors d’exemples pour accroître la capacité d’actions de l’intelligence artificielle face à des problématiques données. Selon les cas observés, les paramètres s’ajustent ainsi automatiquement afin de réagir efficacement devant des situations similaires. Le résultat gagne en pertinence, réduisant la marge d’erreur du système.

Sur la base de fonctions prédictives, l’apprentissage supervisé peut se décliner en différentes techniques et méthodes. C’est notamment le cas de l’arbre de décision (un outil d’aide décisionnelle) ou de la classification naïve bayésienne. Cette dernière se sert de modèles de probabilité. Il existe de nombreuses applications pour mettre en œuvre un apprentissage supervisé :

  • la bio-informatique ;
  • la reconnaissance vocale, des formes ou de l’écriture manuscrite ;
  • le traitement automatique de la langue ;
  • la vision par ordinateur…

En ce qui concerne les usages courants, on retrouve également l’apprentissage supervisé pour la détection de spams dans les mails, la gestion des chatbots, ainsi que la robotique. Cela s’adresse aussi au développement des technologies embarquées dédiées aux véhicules autonomes.

Quels sont les principaux algorithmes d’apprentissage supervisé ?

Afin de créer un apprentissage supervisé, on applique différents algorithmes, selon la méthode employée :

  • la régression linéaire simple : y = c + b * x ;
  • la régression logistique : h(x) = 1 / (1 + e^-x) ;
  • l’arbre de décision avec différentes variables de sortie.

On peut également évoquer l’algorithme k-NN pour réaliser des tests et la classification naïve bayésienne pour des volumes de données importants. Par exemple, le classement d’une page web.

Quelle différence entre apprentissage supervisé et non supervisé ?

En parallèle de l’apprentissage supervisé, il est également possible d’effectuer un apprentissage non supervisé. Le principe reste similaire dans le fait de préserver l’autonomie de l’intelligence artificielle dans ses fonctions. Cependant, la méthode non supervisée n’utilise pas d’exemples ni de modèles d’étiquetage.

En l’absence de ces données de base, le système doit alors s’appuyer sur des critères communs. Selon la cible, il peut s’agir d’une forme ou d’un usage. L’apprentissage non supervisé peut servir à partitionner des données, programmer un système de suggestion ou gérer une opération de clustering. Les fonctions de détection d’anomalies utilisent généralement la technique de l’apprentissage non supervisé.

Dictionnaire de l'intelligence artificielle