Régression linéaire multiple : définition et cas d'usage

La régression linéaire multiple utilise un algorithme d'apprentissage supervisé en vue de déterminer la valeur de variables sur la base de précédentes données. La relation linéaire multiple permet de dégager différentes tendances et prédictions.

La régression linéaire multiple, c’est quoi ?

La régression linéaire multiple se base sur le même principe que la régression linéaire simple : son mode de fonctionnement s’appuie sur des indicateurs numériques déjà existants pour déterminer des valeurs futures. Un système multiple est en mesure de mieux définir la corrélation entre une variable continue et les variables indépendantes qui en découlent. Cela permet une aide à la décision en dégageant une prédiction, une tendance ou un lien, suivant la nature des données analysées.

Il est possible de prévoir un effet plus ou moins impactant sur une échelle de temps spécifique. Si nécessaire, la régression linéaire multiple peut mettre en valeur un comportement cyclique. À noter que les interrogations posées peuvent présenter un caractère généraliste ou se focaliser sur un sujet précis.

Comment réaliser une régression linéaire multiple sous Excel ?

Pour effectuer une régression linéaire multiple avec Excel, il convient tout d’abord d’intégrer le module XLSTAT dans les extensions du tableur. À partir de l’onglet nouvellement installé, il faut ensuite sélectionner l’option "modélisation", puis la fonction "régression linéaire". Le paramétrage se focalise essentiellement sur l’onglet "général" pour réaliser un modèle multiple standard. Cela passe, entre autres, par le renseignement des variables expliquées et explicatives.

La configuration reste similaire à celle d’une régression linéaire simple, à la différence près qu’il est possible de renseigner plusieurs variables explicatives. Le libellé des variables est à laisser coché afin de présenter leur dénomination dans la première colonne du tableau. D’autres onglets permettent de personnaliser avec plus de précision le modèle de régression linéaire multiple :

  • options ;
  • validation ;
  • prédiction ;
  • données manquantes ;
  • sorties.

Après avoir finalisé le paramétrage, il suffit de valider à partir du bouton "ok" et ainsi générer la régression linéaire multiple.

Dans quel domaine la régression linéaire multiple est-elle utilisée par exemple ?

La régression linéaire multiple présente de nombreux champs d’application. Cela s’explique par la prise en charge de plusieurs variables afin de développer des modèles plus complexes qu’un système linéaire simple. On peut donc s’en servir dans les domaines d’expertise suivants :

  • les prévisions météorologiques ;
  • les tendances climatiques sur une zone géographique plus ou moins vaste ;
  • la propagation d’une infection virale à travers un pays ou suivant une classification des personnes contaminées ou à risque ;
  • les études financières et boursières ;
  • l’économétrie ;
  • l’analyse statistique.

Il s’agit là de quelques exemples. Cela ne constitue pas une liste exhaustive des nombreux usages de la régression linéaire multiple.

Dictionnaire de l'intelligence artificielle