Computer vision : définition et applications

Computer vision : définition et applications Membre à part entière de la famille des intelligences artificielles, la computer vision (ou vision par ordinateur en français) a révolutionné le traitement de l'information par les caméras connectées. Explications.

Computer vision : qu’est-ce que c’est ?

Egalement connue dans la langue de Molière sous les termes de "vision artificielle" ou "vision numérique", la vision par ordinateur, ou computer vision, désigne une technique d’intelligence artificielle permettant d’analyser des images captées par un équipement tel qu’une caméra. Concrètement, la computer vision se présente comme un outil basé sur l’IA capable de reconnaître une image, de la comprendre, et de traiter les informations qui en découlent. Pour beaucoup, la vision par ordinateur est l’équivalent, en termes d’IA, des yeux humains et de la capacité de notre cerveau à traiter et analyser les images perçues. La reproduction de la vision humaine par des ordinateurs constitue d’ailleurs l’un des grands objectifs de la computer vision. On recense aujourd’hui de nombreux domaines d’application (le secteur automobile, avec l’émergence des voitures autonomes capables de reconnaître les images de la route, le cinéma, avec la motion capture, les systèmes de reconnaissance faciale des smartphones, etc.).

Applications de computer vision

Ces dernières années, les plus grandes entreprises internationales (Google, Facebook, Amazon, Apple) ont massivement investi dans le deep learning et dans la computer vision. Dans le secteur automobile, le constructeur de véhicules autonomes Tesla a depuis plusieurs années mis l'accent sur la computer vision, plus que sur l'IoT. Le postulat qui justifie cette prise de position : les caméras connectées capables de traiter l'information en temps réel proposent une plus grande fiabilité que les différents capteurs électroniques.

Dans l'énergie, Suez utilise la computer vision dans l'eau et les déchets, notamment pour détecter les objets qui ne sont pas destinés à entrer dans l'incinérateur. Autre exemple dans l'industrie, où la start-up Prophesee entend utiliser les images pour assurer une maintenance prédictive. Par ailleurs, avec la crise du coronavirus, le spécialiste des solutions de sécurité Dahua Technology a réadapté ses caméras pour détecter par computer vision les personnes ayant de la fièvre. 

Comment s’effectue l’apprentissage automatique ?

La vision par ordinateur fonctionne grâce à la combinaison de plusieurs technologies, parmi lesquelles le deep learning. Il s’agit d’une technique d’apprentissage profond par réseaux de neurones grâce à "l’absorption" d’un très grand nombre de données. On parle ici d’une méthode d’apprentissage automatique consistant à transformer une image en une représentation d’un vecteur de données prenant en compte, notamment, l’intensité des pixels, les formes particulières, etc.

Comment extraire du texte à partir d’images ?

La reconnaissance de caractères est l’une des nombreuses autres applications de la computer vision. Il s’agit, dans la pratique, d’extraire du texte à partir d’images, afin de recueillir un ensemble d’informations et d’en conserver une trace écrite. Pour cela, il existe plusieurs applications, parmi lesquelles l’API Vision de Google Cloud. Des alternatives ont également vu le jour pour extraire du texte à partir d’images. C’est le cas par exemple avec le site Internet Free Online OCR.

Dictionnaire de l'IoT