Federated learning : définition et principales techniques

Le federated learning (ou apprentissage fédéré) est une méthode d'apprentissage automatique utilisée dans le domaine de l'IA (Intelligence Artificielle). Moins intrusif que d'autres paradigmes, le federated learning fait beaucoup d'émules. Définition et tour d'horizon des techniques existantes.

Qu'est-ce que le federated learning ?

Le federated learning est une méthode de machine learning (apprentissage automatique). L’algorithme est entraîné directement sur la machine des utilisateurs d’une application. Seuls les apprentissages réalisés sur chaque terminal des utilisateurs sont ensuite partagés.

Cette méthode répond au problème grandissant de confidentialité des données utilisateurs. Elle vise à remplacer, au moins partiellement, la méthode d’apprentissage centralisé appliquée sur les serveurs du fournisseur de service. Google a été le pionnier de cette méthode moins intrusive pour les utilisateurs : les apprentissages sont transmis aux serveurs, mais les données propres des utilisateurs ne quittent pas leur périphérique.

Le federated learning vertical, c'est quoi ?

Le federal learning vertical, ou l’apprentissage fédéré vertical, consiste à résoudre des problématiques complexes en réalisant une fusion de données issues d’un même utilisateur, mais de fonctionnalités différentes.

Concrètement, à partir de la base de données de deux banques distinctes, il consiste par exemple à fusionner la fonction d’épargne bancaire et la fonction de préférence de produit. Pour garantir la confidentialité des données de l’utilisateur, un serveur va procéder à cette fusion de données, qu’il va ensuite masquer et envoyer aux deux sociétés. Elles pourront mettre chacune leur modèle d’apprentissage à jour, sans pour autant connaître les données de l’autre société.

Le federated learning horizontal, qu'est-ce que c'est ?

Le federated learning horizontal, ou apprentissage fédéré horizontal, est une technique qui vise à fusionner des données ayant le même type de fonctionnalités, mais issues d’utilisateurs distits.

Par exemple, pour créer un ensemble de données d’épargne bancaire au niveau européen, il s’agira de fusionner l’épargne bancaire des utilisateurs des pays d’Europe. L’apprentissage s’effectue ici par les échanges entre le groupe d’utilisateurs et un serveur centralisé. Ce serveur réalise une agrégation des données en provenance du groupe sans pour autant apprendre des informations de chaque organisation participante.

Autres techniques de federated learning

Il existe d’autres techniques de federated learning. L’apprentissage fédéré centré sur les données, par exemple : des propriétaires de données privées peuvent permettre à des organisations externes de créer leurs modèles à partir des données propriétaires, sans pour autant partager les données brutes.

L’apprentissage fédéré cross-silo a aussi de belles perspectives : cet apprentissage consiste à agréger des données issues d’organisations très différentes (comme les banques et hôpitaux par exemple) afin de créer de manière collaborative un modèle d’apprentissage automatique tout en préservant les données confidentielles de chaque usager.

Dictionnaire de l'intelligence artificielle