wie kann ich einen eigescannten text vom computer als text erkennen lassen?
Zusätzlich zu den Tipps unten hilft eventuell ein Registry-Scan: Nervige Windows-Fehler lassen sich oft mit einem Aufräumen der Windows Registry beheben. In der Regel läuft und startet Windows danach auch wieder schneller!
Was ja auch nicht erstaunlich ist, denn die eingescannte Seite ist ja ein Bild.
Dieses Bild muß ein OCR-Programm durchlaufen, das die erkannten Zeichen in Text umwandelt. Die beiden besten Programme sind 'Fine Reader' und 'Omnipage'.
Tipps:
Die Seite mit 300 dpi oder maximal mit 400 dpi einscannen.
Eine Farbtiefe von 2 bit reicht aus (also Schwarz-Weiß), die Einstellung 'Graustufen-Photo' ist aber auch okay.
am besten bekommst Du das, glaube ich, mit einer OCRSoftware wie Omnipage 12 oder höher hin. Selbst für Laie ist dieses Programm verständlich. Ist aber nicht "umsonst"
habs mit Office Documant Imaging in text umgewandelt und in word geöffnet, das ergebnis war ganz ok, längere textabschnitte wurden fehlerfrei übernommen, lediglich texte die weiß auf schwarz standen hat er garnicht übernommen.
probleme gab es auch bei einer zeile die weiter mittig und kleiner geschr. war. diese hat er mal eben vom anfang des textes in die mitte verschoben, das gleich machte er mit der letzte zeile, er schob sie fast zum anfang des textes.
gibs eine möglichkeit das ergebnis noch etwas zu verbessern?
Nö. Hab' viel mit OCR experimentiert und natürlich sehr viel eingescannt, sowohl reinen Text als auch Text-Grafik-Mix.
Auflösungen über 400 dpi bringen nur eine minimal bessere Erkennung, dafür steigt die Verarbeitungszeit wegen der wesentlich größeren Bitmap-Dateien enorm an.