AIOps : c'est quoi, et comment en tirer parti ?

AIOps : c'est quoi, et comment en tirer parti ? [AIOPS] AIOps est l'acronyme d'artificial intelligence operations systems. Les systèmes d'AIOps sont conçus pour automatiser les tâches de pilotage et de maintenance des applications et infrastructures informatiques.

L'AIOps, qu'est-ce que c'est ?

Conceptualisée par le Gartner en 2017, la notion d'AIOps (pour artificial intelligence operations systems) renvoie à des outils logiciels combinant l'intelligence artificielle (IA) et l'Ops, c'est-à-dire la gestion des opérations informatiques. En d'autres termes, l'AIOps met les technologie d'IA au service de la production IT. Ce domaine recouvre divers dimensions de l'Ops, du monitoring à la maintenance applicative des systèmes d'information. 

Sur le plan du monitoring, l'AIOps a par exemple pour objectif de réaliser des corrélations au sein des logs des applications pour détecter des signaux pouvant révéler un risque de panne. En ligne de mire : donner la possibilité aux équipes informatiques d'intervenir avant même que la panne ne se produise, dans une logique de maintenance prédictive. Côté administration logicielle, l'AIOps contribue par ailleurs à automatiser les process de mise à jour.  

Comment le Gartner définit l'AIOps ?

Selon la définition du Gartner, "l'AIOps est une technologie associant le big data, le machine learning et d'autres techniques logicielles en vue d'améliorer directement ou indirectement les fonctions d'opération IT : monitoring, automatisation informatique et service desk". Toujours d'après le cabinet d'analyse américain, les plateformes d'AIOps permettent l'utilisation simultanée de plusieurs sources de données, méthodes de collecte de data, process d'analyse en temps réel et en profondeur, et modes de présentation et de data visualisation.

A l'origine, l'acronyme AIOps, pour artificial intelligence operations systems, renvoyait à agorithmic IT operations, une notion conceptualisée par le Gartner en 2016. Elle renvoie à un définition un peu plus large : "Algorithmic IT Operations fait référence aux solutions basées sur des algorithmes d'intelligence artificielle et de machine learning conçues pour résoudre des tâches informatiques et automatiser des traitements répétitifs sans valeur ajoutée", explique le cabinet. Pour clarifier et démocratiser le concept, le Gartner remplace en 2017 "Algorithmic IT" par "Artificial Intelligence", une expression évidemment plus populaire.  

Architecture d'un système d'AIOps à l'état de l'art selon le Gartner. © Gartner / 2017

Quels sont les bénéfices de l'AIOps ?

A l’ère de la transition numérique à grande échelle, les infrastructures informatiques sont de plus en plus complexes. Reposant sur un traitement très manuel des données de supervision et de monitoring IT, les méthodes de gestion traditionnelles de ces équipements génèrent de facto des problèmes de maintenance et des ralentissements. Face à cette problématique, les solutions d'AIOps automatisent les principales fonctions des opérations informatiques, et réduisent sensiblement ces ralentissements et les bruits anormaux d’alerte.

Les plateformes d'AIOps sont taillées pour fédérer et corréler automatiquement les données techniques sur l'état des infrastructures logicielles et des applications. Elles contribuent ainsi à plus de proactivité, et à une identification ciblée des sources d’erreurs quand ces dernières surviennent, ainsi qu'à orchestrer un environnement de workflow automation pour gérer les mises à jour logicielles et les tâches de maintenance répétitives.

Quelles sont les fonctionnalités d'un système d'AIOps ?

D'après le cabinet américain d'analyse en nouvelles technologies Gartner, les principales fonctionnalités d’une plateforme AIOps (pour artificial intelligence operations systems) sont les suivantes :

  • Ingestion de données applicatives et logs issus de sources multiples
  • Capacité d’analyse en temps réel
  • Capacité à réaliser des analyses sur les données d'historique
  • Machine learning pour automatiser l'exécution des tâches informatiques et améliorer ce mode d'exécution au fur et à mesure
  • Capacité à déclencher une tâche ou un processus en fonction des résultats des analyses.

Quels sont les principaux outils d'AIOps ? 

Le développement des solutions d'AIOps ne cessent de croître. C’est une tendance forte pour les grandes entreprises comme pour les PME qui commencent à s’équiper de ces solutions. Aujourd’hui principalement axés sur la détection proactive d'anomalies logicielles, le diagnostic et la priorisation, ces outils sont proposés par plusieurs sociétés informatiques. Parmi les plus connues figurent Aruba (groupe HP), BMCIBM, ServiceNow, Splunk, ou encore les pure player Dynatrace et Moogsoft.

La plateforme d'AIOps de Splunk (Splunk IT Service Intelligence) permet d'afficher plusieurs services IT côte à côte et de corrélez leurs métriques au fil du temps pour identifier les causes des problèmes informatiques. © Splunk

Quels sont les principaux cas d'usage (use case) de l'AIOps ?

Le Gartner a listé ce qu'il considère comme les principaux cas d’usage des solutions d'AIOps. Ceux-ci, au nombre de cinq, concernent :

  • La gestion du big data
  • L’analyse des performances informatiques,
  • La détection des anomalies
  • La corrélation et l’analyse des événements de type log
  • La gestion des services informatiques.

AIOps vs MLOps : quelle différence ?

L'AIOps (pour artificial intelligence operations systems) et le MLOps (pour machine learning ops) sont deux notions très différentes. Alors que l'AIOps est centrée sur l'automatisation des tâches de maintenance et de production informatique, le MLOps renvoie à la création de pipelines automatisés dessinés pour entrainer et déployer des modèles de machine learning.

A la différence de l'AIOps, le MLOps ne fait donc pas référence à un domaine d'application des algorithmes de machine learning mais à la manière de fluidifier le développement, l'apprentissage et la mise en production de ces algorithmes. En cela il se rapproche par conséquent du DevOps