TesseractNotFound Error: tesseract is not installed or it's not in your path : quelle est la solution ?

Tesseract est un outil de reconnaissance de caractères (OCR). Il est capable d'analyser les textes contenus dans une image pour ensuite les transformer en chaînes de caractères que vous pouvez exploiter. Le logiciel peut être manipulé par le biais de librairies spécifiques. Dans le langage Python, le paquet PyTesseract permet de communiquer avec le logiciel. Voici les étapes pour le faire fonctionner sur votre ordinateur et éviter le message d'erreur : "Error: tesseract is not installed or it's not in your path".

La première étape consiste à installer le logiciel Tesseract sur votre machine. Vous devez vous rendre sur le site du logiciel et télécharger un des installeurs compatibles avec votre système d'exploitation : https://tesseract-ocr.github.io/tessdoc/Downloads.html. Une fois le logiciel installé, vous devez noter le répertoire au sein duquel il est stocké. Par défaut, si vous travaillez avec Windows, le chemin est "C:\Users\<votre-utilisateur>\AppData\Local\Tesseract-OCR".

Une fois ceci fait, il faut maintenant s'occuper de votre installation Python. Vous devez installer le paquet "pytesseract". Il fournit les fonctions et classes nécessaires pour piloter le logiciel depuis votre code. Comme pour la plupart des paquets Python, vous pouvez utiliser pip, le gestionnaire de paquets fourni avec votre installation.

pip install pytesseract

La dernière manipulation se passe dans votre code. Il existe une variable de la librairie "pytesseract" qui doit contenir le chemin permettant d'exécuter le logiciel. Vous devez renseigner dans cette variable le dossier d'installation que vous avez noté, suivi du nom de l'exécutable du logiciel "tesseract.exe". Vous pouvez ensuite écrire le code dont vous avez besoin pour piloter le logiciel.

pytesseract.pytesseract.tesseract_cmd = r'C:\Users\<votre-utilisateur>\AppData\Local\Tesseract-OCR\tesseract.exe'
//Écrivez ensuite votre code

Python