Natural language generation (NLG) : définition, fonctionnement, applications

La natural language generation (NLG) utilise le machine learning et d'autres techniques d'apprentissage pour transformer des ensembles de données en récits écrits. Cette génération automatique de texte ou du langage naturel est omniprésente dans de nombreuses applications.

La natural language generation (NLG), qu'est-ce que c'est ?

La génération du langage naturel, ou encore Natural Language Generation (NLG), est un sous-domaine du traitement du langage naturel. Elle fait appel à des algorithmes produisant un langage naturel à partir de données structurées, en transformant les données d’un data set en récits. Lesdits récits peuvent être basés sur les données, ou créés en partie ou en totalité par la machine en utilisant des associations entre les données.

Ces modèles sont entraînés avec des outils de machine learning, de deep learning ou des réseaux neuronaux. Cette génération automatique fait l’objet de recherches depuis longtemps. Toutefois, elle a connu récemment des avancées majeures, et les applications concrètes se multiplient.

Comment fonctionne la natural language generation (NLG) ?

Un modèle basé sur la natural language generation (NLG) peut générer du langage naturel dans un grand nombre de formats, à partir d’un très grand nombre de sources, afin de fournir des résumés, des réponses aux questions, voire des articles entiers.

Pour cela, les algorithmes transforment les données sur la base d’un modèle prédéfini, ou prédisent les mots devant être générés ensuite en faisant appel aux statistiques. Grâce aux techniques d'apprentissage automatique, des patterns fréquents sont reconnus dans les textes existants, et réutilisés pour produire un nouveau texte. Les modèles sont aussi entraînés à reconnaître les données importantes au sein d’un data set.

Quelles sont les principales applications de la natural language generation (NLG) ?

Aujourd'hui, la NLG est utilisée dans une large variété de domaines. Elle suggère des phrases courantes dans les services d’e-mail, compose des résumés automatiques d’articles pour les agences de presse, ou produit des réponses probables aux questions pour les FAQ en ligne, les assistants vocaux et les chatbots.

La natural language generation (NLG) est aussi utilisée pour produire de longs textes tels que des articles de presse, avec les systèmes sophistiqués. Le plus connu est le système GPT-3 de la société OpenAI, qui est considéré comme l’intelligence artificielle la plus avancée dans ce domaine. En fait, tous les internautes bénéficient d’un produit recourant à la NLG.

Natural language generation (NLG) vs natural language understanding (NLU) : quelle différence ?

La Natural language generation (NLG) et le natural language understanding (NLU) font tous les deux partie du traitement du langage naturel, domaine de l’intelligence artificielle en plein essor. Le NLU est en fait une étape clé qui précède la NLG. Car, avant de pouvoir générer automatiquement du texte, il faut l’analyser et le comprendre ! Le NLU s’attache à cela, en extrayant les données des mots pour en comprendre le sens et leurs relations ! Le NLU est donc essentiel pour faire de la NLG une réalité.

Dictionnaire de l'intelligence artificielle