Dienstag, 1. Januar 2013

tesseract mit Python

Bin gerade über die PyCologne-Seite auf Facebook zum Artikel Python-Skript erkennt Gesichter, Haut und Texte von Anton Moser, Kerstin Ramer, Matthias Schrattenholzer, Rainer Poisel im LinuxMagazin, Ausgabe Juli 2012 gelangt. Nicht alles finde ich direkt interessant, aber die Möglichkeit auf tesseract mittels Python zuzugreifen, erscheint mir spannend und könnte ich zeitnah gebrauchen.

Der beim Artikel angegebene Link führt IMHO ins Nirvana, aber anscheinend wurde der Code auf github ausreichend geteilt, so findet er sich u. a. hier bei Juarez Bochi (jbochi) mit Verweis auf den ursprünglichen Autor Samuel Hoffstaetter (?) des Skripts - auf ihn verweist jedenfalls der Link des Linux Magazins.

Ich habe das Skript soeben zum Laufen bekommen. Einziges Manko ist m. E., dass es Python 2.7 verwendet und nicht direkt mit Python 3.2 läuft. Dafür habe ich mit der Installation jetzt aber FreeOCR 4.2 abgeschossen, auch eine Neuinstallation brachte es gerade nicht.

Manko bei Nutzung von python-tesseract ist lediglich, dass man keine Bildbereiche über ein GUI vorauswählen kann. Das geht mit FreeOCR.

Keine Kommentare:

Kommentar veröffentlichen