Analyse prédictive : définition, algorithme et cas d'usage

L'analyse prédictive consiste à développer un modèle, recourant aux résultats connus, pour extrapoler de nouvelles valeurs, grâce notamment à la régression linéaire ou la régression logistique. Elle sert à anticiper des événements sur la base d'événements passés. Quels sont ses cas d'usage ?

L'analyse prédictive, c'est quoi ?

L’analyse prédictive a recours aux ensembles de données disponibles pour anticiper les résultats futurs les plus probables en se fiant aux résultats survenus, grâce à des algorithmes statistiques, l’extraction des connaissances et des techniques de machine learning. Elle fait aussi appel à la théorie des jeux pour établir les hypothèses.

Contrairement aux modèles dits descriptifs, qui s’attachent à comprendre les événements passés ou à déterminer les causes des résultats précédents, l'analyse prédictive vise à extrapoler de nouvelles valeurs ou données. L’analyse prédictive peut par exemple chercher à prédire un comportement ou encore un risque.

Les modèles prédictifs tentent de capturer les relations existantes entre plusieurs facteurs pour évaluer les probabilités que les mêmes résultats se répètent. Ce type d’analyse est particulièrement utile pour l’aide à la prise de décision, et le classement des clients dans différentes catégories en fonction des risques et opportunités qu’ils représentent.

Quels sont les principaux cas d'usage de l'analyse prédictive ?

Dans le monde de l’entreprise, l’analyse prédictive est massivement utilisée pour analyser les risques que représente un client, en particulier dans le secteur bancaire et assurantiel, ou au contraire les opportunités marketing à explorer. Elle sert ainsi à découvrir certains "patterns" dans le comportement des clients, pour mieux fidéliser les consommateurs.

L'analyse prédictive joue aussi un rôle dans la détection des fraudes, en optimisant les schémas de détection et anticipant les activités criminelles. En matière de cybersécurité, elle permet d’analyser en temps réel les activités sur un réseau, à repérer les anomalies ou les vulnérabilités de type "zero-day", ainsi qu’à anticiper les prochaines attaques.

Parmi les autres cas d’usage : les entreprises peuvent se servir de l'analyse prédictive pour optimiser les processus de production, mieux prévoir les stocks et les ressources à déployer, ou estimer les futures commandes et réservations.

En analyse prédictive, comment fonctionne l'algorithme de régression linéaire ?

Pour réaliser une analyse prédictive, il est possible de recourir à un modèle de régression linéaire, qui va déterminer la relation entre la variable dépendante ou réponse et la variable indépendante ou prédictive. Cette équation prédit les valeurs de la variable dépendante ou réponse comme une combinaison linéaire de paramètres, ces derniers étant ajustés de façon à optimiser l’estimation et à minimiser la somme des résidus au carré.

En analyse prédictive, comment fonctionnent les algorithmes de régression logistique et de régression logistique multinomiale ?

Il est fréquent d’utiliser aussi des algorithmes de régression logistique, qui vont transformer l'information sur la variable dépendante binaire en une variable continue illimitée, estimée grâce à un modèle d'analyse multivariée. Ou des algorithmes de régression logistique multinomiale, dans les cas où la variable réponse a plus de deux catégories.

Dictionnaire de l'intelligence artificielle