Es gibt verschiedene Tools für Texterkennung in Linux. Am einfachsten ist meiner Meinung nach immer noch XSane zu benutzen um die Dokumente einzuscannen. XSane kann dann die eingescannten Dokumente an verschiedene Texterkennungsprogramme weiterleiten. Ich habe sowohl GOCR wie auch Ocrad verwendet, bin aber zum Schluss gekommen, dass Tesseract für deutsche Texte am zuverlässigsten funktioniert.