Texterkennung mit XSane und Tesseract
Posted by hyper_ch on 06 May 2010 | Tagged as: Debian, dergringo, Desktops, KDE, Ubuntu, Xfce
Es gibt verschiedene Tools für Texterkennung in Linux. Am einfachsten ist meiner Meinung nach immer noch XSane zu benutzen um die Dokumente einzuscannen. XSane kann dann die eingescannten Dokumente an verschiedene Texterkennungsprogramme weiterleiten. Ich habe sowohl GOCR wie auch Ocrad verwendet, bin aber zum Schluss gekommen, dass Tesseract für deutsche Texte am zuverlässigsten funktioniert.