Régression linéaire : définition, fonctionnement et interprétation

La régression linéaire est un modèle qui permet de réaliser des prédictions ou des estimations sur la base de valeurs existantes. À partir d'un algorithme d'apprentissage supervisé, une relation linéaire est établie entre une variable expliquée et une variable explicative.

Une régression linéaire, qu’est-ce que c’est ?

Aussi appelée modèle linéaire, la régression linéaire est un modèle statistique qui effectue des fonctions prédictives. Pour réaliser des estimations pertinentes, le processus s’appuie sur des valeurs numériques afin de dégager une tendance ou une évolution prévisible. Par le biais d’un dataset, le système permet ainsi de les extrapoler et d’anticiper des valeurs futures.

La régression linéaire présente plusieurs champs d’application. Cela vaut pour développer une intelligence artificielle de type machine learning, capable d’apprendre de nouvelles règles et fonctions par elle-même. L’économétrie, les statistiques et les tendances boursières utilisent également d’un modèle linéaire.

Comment interpréter les résultats d’une régression linéaire ?

La régression linéaire permet de mettre en corrélation différentes variables. Les résultats obtenus restent des prédictions, voire des estimations. Par conséquent, il persiste un domaine d’incertitudes, et ce, malgré la fiabilité du système. L’interprétation doit donc considérer le modèle linéaire comme un support d’aide à la décision et non comme une vérité établie.

Comment faire une régression linéaire sur Excel ?

En utilisant Excel, il est possible de réaliser une régression linéaire. Après avoir installé l’extension XLSTAT, il faut lancer la commande, sélectionner l’onglet "modélisation des données", puis la fonction "régression linéaire". Le paramétrage se fait de la manière suivante :

  • Définir les variables dépendantes et explicatives.
  • Activer le libellé des colonnes.
  • Sélectionner l’option "Résidus" avant d’analyser les données.

Il est possible de déterminer d’autres options à partir des onglets validation, prédiction ou encore graphiques. Tout dépend du modèle statistique que l’on souhaite obtenir, le degré de précision et la nature des variables à rapprocher.

Régression linéaire simple vs régression linéaire multiple : quelle différence ?

La régression linéaire simple développe son modèle sur l’usage d’une seule variable expliquée (dépendante) pour générer une variable explicative de nature indépendante, soit la prédiction que l’on souhaite obtenir. Dans une régression linéaire multiple, le système s’appuie sur le même principe qu’un modèle simple, mais il permet de dégager au moins 2 variables explicatives. il est donc possible d’avoir plusieurs informations sur la base d’un facteur unique.

Comment faire une régression linéaire avec R et avec Python ?

Après avoir installé R ou Python, l’emploi de la régression linéaire demande d’intégrer les bibliothèques et données associées. Pour R, il faut utiliser la fonction read_csv2. S’il s’agit de Python, il est nécessaire de posséder la bibliothèque Pandas. Il est également recommandé d’installer les modules Numpy et Matplotlib pour bénéficier des outils de visualisation.

Dictionnaire de l'intelligence artificielle