f:mp. Papierlexikon



Suche:
  

OCR/ICR

Optical Character Recognition/Intelligent Character Recognition, dt. Optische/intelligente Zeichenerkennung. Gedruckte Textvorlagen werden gescannt und mit Hilfe einer OCR-Software (z.B. Omnipage) in editierbare Zeichen gewandelt. Der Text kann anschließend korrigiert und verarbeitet werden. Es gibt zwei Verfahren. Erstens: Ein OCR-Programm erkennt nur Texte in einem ganz bestimmten Zeichensatz, da es in diesem Font gespeicherte Buchstaben mit den digitalisierten Texten vergleicht. Zweitens: Diese flexiblere Lösung arbeitet mit Beschreibungen der grundlegenden Merkmale eines Buchstabens: Eine ICR-Software definiert den Buchstaben i als senkrechten Strich, über dem ein Punkt schwebt. So kann die Software praktisch alle Schriften, auch Grotesk- oder Serifenschriften, identifizieren. Die Erkennungsquoten auch dieser (von den Herstellern als intelligent bezeichneten) Programme liegen zwar sehr hoch (über 99 Prozent), doch dieser Wert bedeutet, daß alle hundert Zeichen ein Fehler auftritt. Für viele Seiten sind deshalb Korrekturverfahren mit Hilfe digitalisierter Lexika notwendig.


Quelle

Haberbeck

Papierlexikon "Deutsch, Englisch, Finnisch, Französisch"