Inférence bayésienne : tout comprendre

L'inférence bayésienne est un raisonnement logique basé sur la probabilité d'une hypothèse. D'autres notions, comme la vraisemblance et l'optimisation bayésiennes, s'articulent autour de cette démarche probabiliste. Explications et exemples d'application.

L'inférence bayésienne, c'est quoi ?

L’inférence bayésienne est une technique algorithmique ayant pour but de calculer le degré de confiance à accorder à une hypothèse. L'inférence bayésienne est basée sur le théorème de Bayes qui établit les principes de calcul d’une probabilité conditionnelle. Trois principes fondamentaux caractérisent la méthode d’inférence bayésienne :

  • La connaissance antérieure est intégrée dans le calcul de la probabilité.
  • Lors de l’acquisition d’une nouvelle donnée, l’hypothèse est alors évaluée suivant ce niveau de connaissance antérieure.
  • La méthode de calcul est itérative, c’est-à-dire que, à chaque nouvelle information, le calcul est révisé et les résultats réévalués, toujours en fonction de ce niveau de connaissance antérieure.

Par cette méthode, la prédiction est ainsi affinée progressivement.

Qu'est-ce que le raisonnement bayésien ?

Le raisonnement bayésien qui sous-tend cette méthode repose sur l’idée que chaque probabilité est conditionnelle. La probabilité bayésienne est interprétée comme un degré de croyance. Par ailleurs :

  • La probabilité s’affine et se met à jour dès que l’on dispose d’une nouvelle information (l’apprentissage statistique est réalisé par l’assimilation de nouvelles données brutes).
  • La véracité du raisonnement bayésien et sa cohérence sont soutenues par les règles mathématiques du calcul des probabilités.

Les données brutes et les hypothèses conditionnent conjointement le raisonnement bayésien et permettent de restreindre l’écart entre le petit monde du formel et le grand monde du réel.

L'optimisation bayésienne, qu'est-ce que c'est ?

L’optimisation bayésienne est à la base de nombreuses stratégies déployées dans le domaine informatique et de l’IA (intelligence artificielle) plus spécifiquement.

Ces stratégies découlent directement de l’inférence bayésienne et des méthodes de calcul associées (approche probabiliste). Elles regroupent des techniques très performantes qui permettent de déterminer des valeurs optimales et des informations exploitables à partir d’un nombre d’observations limité. Un algorithme d’optimisation bayésienne permet par exemple de déterminer une configuration automatique efficace de base de données sans passer par de nombreux tests souvent indispensables dans ce domaine.

En un minimum d’observations, l’algorithme est en capacité de déterminer les paramètres requis pour une configuration optimale. Il permet de minimiser les contraintes de temps et les coûts matériels.

Qu'est-ce que la vraisemblance bayésienne ?

La vraisemblance est une fonction des paramètres d’un modèle statistique. Dans l’approche bayésienne, quand la densité de probabilités conjointes associée à des données expérimentales est identifiée, elle définit la fonction de vraisemblance (plausibilité d'une valeur des paramètres d'un modèle).

Dictionnaire de l'intelligence artificielle