Start ·  Blog ·  Debian ·  FreeDict ·  Softwareprojekte ·  Veröffentlichungen ·  Impressum  · Page in English

Papierzutext

Kurze Übersicht

Papierzutext entstand aus dem Wunsch heraus eine Oberfläche zum Scannen, Texterkennen und -lesen zu haben, welche auf der Kommandozeile läuft und Tesseract benutzt. Die momentan verfügbaren Programme erfüllen diese Anforderung nicht. Ferner sind die meisten nicht für den Stapelscan von Büchern (mit parallel ablaufender Texterkennung) geeignet.

Gerade die Parallelität habe ich bei einigen freien Lösungen bisher vermisst. Viele günstige Scanner ziehen die Lampe nach dem Erfassen des Bildes sehr langsam zurück. Dem Rechner ist „langweilig”, obwohl das Bild bereits vorliegt. Papierzutext läuft daher in zwei Threads und stößt die Texterkennung im Hintergrund an. Auf meinem Laptop mit einem einkernigen Prozessor ist damit die Texterkennung, wenn Graustufenbilder eingelesen werden, bereits fertig, wenn der Scanner das Zurückziehen der Lampe beendet hat.

Feature-Liste

1 beim Scannen werden unreinheiten auf der Glasoberfläche oder optische Störungen als Flecken erkannt, Exactimage versucht diese zu entfernen.

Herunterladen / Quellen

Du bekommst die Version 0.1 hier als Tarbarchiv oder etwas aktueller per Git:
git clone http://www.crustulus.de/git/papierzutext

Für Installationshinweise kannst du in der Datei INSTALL nachschauen.

Entwicklung

Weiterentwicklung findet sporadisch und immer wenn nötig statt. Daher wird dein Feedback mich sicher weiter motivieren das Programm zu verbessern. Mail an:
shumenda // at \\ gmx ^^ PuNkT ^^ de

Powered by Debian GNU/Linux
© Sebastian Humenda, zuletzt geändert am 07.10.2015