Tesseract (logiciel)

Informations
Développé par	Ray Smith (d)
Dernière version	5.5.0 (10 novembre 2024)
Dépôt	github.com/tesseract-ocr/tesseract.git
Assurance qualité	Intégration continue
Écrit en	C++
Système d'exploitation	GNU/Linux, Microsoft Windows, macOS, BSD, GNU/Hurd (d), Android et iOS
Environnement	Linux, OpenBSD, Mac OS X, Windows
Formats lus	TIFF, Portable Network Graphics, JPEG File Interchange Format, JP2 (d) et WebP
Formats écrits	HOCR (en), fichier texte, Portable Document Format, ALTO (XML) et TSV
Type	OCR
Licence	Apache
Documentation	tesseract-ocr.github.io
Site web	https://github.com/tesseract-ocr/tesseract

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus.

Cet article ne cite pas suffisamment ses sources (septembre 2023).

Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ».

En pratique : Quelles sources sont attendues ? Comment ajouter mes sources ?

Tesseract est un logiciel de reconnaissance optique de caractères sous licence Apache.

Conçu par les ingénieurs de Hewlett Packard de 1985 à 1995, son développement est abandonné pendant les dix années suivantes ; en 2005, les sources du logiciel sont publiées sous licence Apache et Google poursuit son développement. Initialement limité aux caractères ASCII, il reconnaît les caractères UTF-8 dans plus de 100 langues.

Notes et références

↑ (en) « Release 5.5.0 · tesseract-ocr/tesseract » (consulté le 11 novembre 2024)

Articles connexes

Transkribus

Liens externes

(en) Announcing Tesseract OCR (Luc Vincent, Google Code Blog, août 2006)

Portail des logiciels libres

[wikidata-69f0c317cd3459f721baaa1ead2c4f76d2956a03-1] (en) « Release 5.5.0 · tesseract-ocr/tesseract » (consulté le 11 novembre 2024)

[1]