Analyse prédictive : définition, algorithme et cas d'usage

Analyse prédictive : définition, algorithme et cas d'usage L'analyse prédictive extrapole des prédictions à partir d'un historique de données, grâce notamment à la régression linéaire ou la régression logistique. Elle sert à anticiper des événements sur la base d'événements passés.

L'analyse prédictive, c'est quoi ?

Contrairement aux modèles dits descriptifs, qui s’attachent à comprendre les événements passés ou à déterminer les causes des résultats précédents, l'analyse prédictive vise à extrapoler de nouvelles valeurs ou informations à partir d'un historique de données. L’analyse prédictive peut par exemple chercher à prédire un comportement ou un risque.

Comment fonctionne une analyse prédictive ?

L'analyse prédictive applique des techniques d'algorithmes statistiques, d'extraction des connaissances et de machine learning à des jeux de données passés et actuels pour anticiper les résultats futurs les plus probables par extrapolation. Elle fait aussi appel à la théorie des jeux pour établir les hypothèses.

Qu'est-ce qu'un modèle prédictif ?

Les modèles prédictifs tentent de capturer les relations existantes entre plusieurs facteurs pour évaluer les probabilités que les mêmes résultats se répètent. Ce type d'analyse est particulièrement utile pour l'aide à la prise de décision, et le classement des clients dans différentes catégories en fonction des risques et opportunités qu'ils représentent.

Quels sont les principaux cas d'usage de l'analyse prédictive ?

Dans le monde de l’entreprise, l’analyse prédictive est massivement utilisée pour analyser les risques que représente un client, en particulier dans le secteur bancaire et assurantiel, ou au contraire les opportunités marketing à explorer. Elle sert ainsi à découvrir certains "patterns" dans le comportement des clients, pour mieux fidéliser les consommateurs.

L'analyse prédictive joue aussi un rôle dans la détection des fraudes, en optimisant les schémas de détection et anticipant les activités criminelles. En matière de cybersécurité, elle permet d’analyser en temps réel les activités sur un réseau, à repérer les anomalies ou les vulnérabilités de type "zero-day", ainsi qu’à anticiper les prochaines attaques.

Parmi les autres cas d’usage : les entreprises peuvent se servir de l'analyse prédictive pour optimiser les processus de production, mieux prévoir les stocks et les ressources à déployer, ou estimer les futures commandes et réservations.

En analyse prédictive, comment fonctionne la régression linéaire ?

Pour réaliser une analyse prédictive, il est possible de recourir à un modèle de régression linéaire, qui va déterminer la relation entre la variable à expliquer, également appelée variable à régresser, variable réponse ou variable dépendante, et la variable explicative, ou variable indépendante dite régresseur. Si la variable à expliquer renvoie au niveau de tension artérielle, la variable explicative pourra être l'âge. 

Cette équation prédit les valeurs de la variable explicative comme une combinaison linéaire entre la variable explicative et à la variable à expliquer, les paramètres étant ajustés de façon à optimiser l’estimation et à minimiser la somme des résidus au carré.

Comment fonctionnent la régression logistique et la régression logistique multinomiale ?

Dans un modèle de régression logistique, la variable à expliquer ou variable dépendante renvoie à un nombre fini de valeurs (données dites discrètes) là où dans un modèle linéaire la variable est continue. La  régression logistique s'applique donc pour la classification binaire ou la classification multi-classes. Dans ce second cas, le modèle de régression logistique est dit multinomial.

Dictionnaire de l'intelligence artificielle