Vergleichstest: 3 OCR Engines unter Linux

Neulich kam meine Frau mit der Bitte, ein als PDF empfangenes Fax in Text umzuwandeln. Denn im PDF-Betrachter konnte man nur Graphik ausschneiden, aber keinen Text. Also Zeit für mich, mich mal ein wenig mehr mit den OCR (Optical Code Recognition) Programmen unter Linux zu beschäftigen.

Die Konkurrenten

Wenn man in Debian/Squeeze den folgenden Befehl eingibt, dann sieht man eine ganze Menge Programme die laut Beschreibung etwas mit OCR zu tun haben.

Tatsächlich sind aber einiges davon einfach nur Frontends für die OCR Engines. Das tatsächliche Feld der Engines beschränkt sich auf exakt drei.

gocr

Die gocr Engine hat ihre Homepage bei Sourceforge. Die Entwicklung startete wohl im Jahr 2000, die letzte News auf der Homepage ist von 2010. Die aktuelle Version ist 0.49, Debian/Squeeze installiert die Vorläuferversion 0.48.

ocrad

Die Homepage der ocrad Engine ist beim GNU-Projekt gehostet. Die erste Version ist vom 2004, die aktuelle Version 0.22 ist vom Januar 2012. Debian/Squeeze bringt die Version 0.17 mit.

tesseract

Die tesseract Engine findet man zum einen bei Sourceforge, dort liegt eine Version 1.0 zum Runterladen bereit. Außerdem ist tesseract auch bei Google Code gehostet und dort erfährt man mehr darüber. Die Ursprünge von tesseract gehen wohl auf das Jahr 1995 zurück, damals wurde sie von HP entwickelt. Bis 2006 führte die Engine wohl ein Schattendasein, seitdem wird aber fleißig entwickelt und bei Google gibt es die Version 3.01 zum Runterladen. Debian/Squeeze wartet mit der Version 2.04 auf. Google behauptet, tesseract wäre die beste OCR Engine, ob das stimmt wollen wir nun mal sehen.

2 Gedanken zu „Vergleichstest: 3 OCR Engines unter Linux

  1. Pingback: Ein Link, zwei, drei, vier… | König von Haunstetten

  2. Dankeschön, für Ihre Mühen!
    bin gerade dabei alles auf Linux(Ubuntu) zu portieren, später auf OpenSuse,
    OCR ist und war mein Steckenpferd 🙂 Vielen Dank nochmal..

Kommentare sind geschlossen.