Time series : comprendre le rôle de la série temporelle

Time series : comprendre le rôle de la série temporelle

Les séries temporelles ou séries chronologiques sont des suite de valeurs numériques représentant l'évolution d'une variables dans le temps.

Les séries temporelles, c’est quoi ?

Les time series (que l'on traduit par séries chronologiques ou séries temporelles) se présentent sous la forme d'une suite de valeurs numériques correspondant à l'évolution d'une variable dans le temps. Historiquement utilisées en économétrie, elles sont conçues pour analyser une tendance passée et prévoir son évolution dans le futur par le biais de statistiques ou de probabilités. 

Les séries temporelles en machine learning

Les time series sont très utilisées en apprentissage machine pour concevoir des modèles de classement, de clustering, de prédiction ou de détection d'anomalie.

Qu’est-ce que les séries temporelles multivariées ?

On distingue deux grands types de séries temporelles : les séries temporelles univariées et les séries temporelles multivariées. Leur principale différence tient au nombre de variables pour un indicateur de temps donné. Une série temporelle univariée se limite à l'évolution d'une variable unique dans le temps. Une série chronologique multivariée regroupe, elle, plusieurs séries univariées. Elle permet d'identifier les corrélations entre plusieurs variables évoluant dans le temps.

Que signifie time series analysis ?

L'analyse de séries temporelles est une manière d'analyser une séquence de points de données chronologiques. Elle consiste à enregistrer ces points de données à intervalles réguliers sur une période de temps définie. Les principaux éléments d’étude de la time series analysis sont les suivants :

  • La valeur numérique ;
  • La saisonnalité ;
  • Les cycles ;
  • Les tendances.

L'analyse de séries temporelles permet d'identifier des liens, des facteurs de causalité ou de réaliser une prédiction.

Une time series database, c'est quoi ?

Une time series database (TSDB), ou base de données de séries temporelles, est un serveur logiciel optimisé pour stocker et diffuser des séries chronologiques par le biais de paires associant un valeur de temps à une variable.

En quoi consiste le time series clustering ?

La clustering de séries temporelles consiste à partitionner un jeu de points de données temporels en groupes de points similaires en vue d'en appréhender la structure. La méthode K-means permet de réaliser cette opération.

Quelles sont les méthodes de time series forecasting (prédiction) ?

Afin d’exploiter les fonctions de prédiction d’une série temporelle, il existe différentes méthodes :

  • Le lissage exponentiel ;
  • Les tendances linéaires et autorégressives ;
  • Les moyennes mobiles ;
  • Les ajustements saisonniers ;
  • Les équations de Yule-Walker.

Time series database vs time series dataset : quelle différence ?

La time series database est une base de données optimisée pour les valeurs horodatées. Celles-ci sont collectées suivant des laps de temps prédéfinis. Quant aux données de séries chronologiques, il s'agit simplement de mesures ou d'événements qui sont suivis, surveillés, sous-échantillonnés et agrégés au fil du temps.