Comment ouvrir un fichier Excel avec Pandas et éviter l'erreur "XLRDError(FILE_FORMAT_DESCRIPTIONS[file_format]+'; not supported')" ?

La librairie "Pandas" est une librairie conçue pour l'analyse et la manipulation de données. C'est une librairie très populaire dans le langage Python. Les fichiers Excel étant un des supports les plus répandus pour le stockage de données, cette librairie permet bien entendu d'ouvrir et de manipuler les données issues de ce format. Elle fait pour cela appel à d'autres librairies spécialisées. C'est l'utilisation de ces librairies qui déclenchent le message d'erreur "XLRDError(FILE_FORMAT_DESCRIPTIONS[file_format]+'; not supported')".

Avant la version 1.2, la librairie "Pandas" utilisait la librairie "xlrd" pour manipuler les deux formats les plus populaires pour les fichiers Excel : ".xls" et ".xlsx". La librairie "xlrd" a désactivé la gestion du format ".xlsx" à cause de gros problèmes de sécurité. C'est le fait d'ouvrir un fichier "xlsx" avec la librairie "xlrd", utilisée par défaut, qui déclenche l'affichage du message d'erreur.

Pour résoudre ce souci, il faut utiliser une autre librairie pour ouvrir les fichiers dont l'extension se termine par ".xlsx". La librairie "openpyxl" est spécialisée dans ce domaine et supportée par "Pandas". Vous pouvez trouver cette librairie à partir de son site : https://openpyxl.readthedocs.io/en/stable/. Une fois la librairie installée, il suffit de préciser la librairie appelée avec le paramètre "engine" pour enlever le message d'erreur et correctement ouvrir le fichier.

pandas.read_excel('mon_fichier.xlsx', engine='openpyxl')

Depuis la version 1.2 de "Pandas", il n'y a plus besoin de préciser l'utilisation de la librairie "openpyxl" pour ouvrir un fichier dont l'extension se termine par "xlsx". La librairie est maintenant directement utilisée par défaut.

Python