Wie aus Texten Textdateien werden

Archive sind nach wie vor für einige Menschen dunkle, modrige Keller und lange Regalreihen, in denen Aktenordner, muffige Bücher und Zettelhaufen lauern, voll mit Informationen aus vergangenen Tagen. Und so ganz falsch ist dieses Bild nicht, wenn auch stark überzeichnet. Dennoch sind in unzähligen Firmen noch jetzt wertvolle Daten auf Medien gespeichert oder eben handschriftlich festgehalten, deren Nutzung eine mühsame Suche nötig machen. Diese Archive zu digitalisieren ist ein Schritt, der die Abläufe in Betrieben unheimlich vereinfachen würde. Viele scheuen sich aber vor der praktischen Umsetzung, vor allem, da oft gar nicht klar, wie sie vonstatten gehen soll. Diese Marktlücke wurde von etlichen auf digitale Archivierung spezialisierte Dienstleister gefüllt.

Scannen und umwandeln

Solche Unternehmen haben die entsprechenden technischen Hilfsmittel, die den Umstieg von analogen zu digitalen Medien ermöglichen. Zum Einsatz kommen spezielle Scangeräte, die sämtliche Vorlagen in großer Menge einlesen und als Rastergrafiken, also einfacher Bilder, darstellen. Scanner eben, bloß größer und schneller. Dieser Vorgang speichert die wertvollen Daten zwar, allerdings kaum anders, als es ein schlichtes Foto getan hätte. Die Bilder allein sind nicht zugänglich und daher für das Unternehmen kaum von Wert. Hier werden OCR-Verfahren verwendet, also Texterkennungsprogramme, die aus den Fotos Textdokumente generieren. In den Anfangsjahren ihrer Entwicklung hatten diese Programme noch große Schwächen, denn Zeichen wurden aufgrund ihrer grafischen Ähnlichkeit oft falsch umgewandelt. Aus einem O wurde eine Null, aus einem Doppel-l die Zahl elf, aus B eine acht. Mittlerweile sind aber auch diese Systeme „intelligent“ geworden und passen das Ergebnis dem jeweiligen Kontext an.

Trotzdem sind auch die intelligentesten – und teuersten – Programme nicht fehlerfrei. Die von ihnen gelieferten Ergebnisse sollten auf jeden Fall noch mit geschultem Auge überprüft werden. In Scandienstleistungs-Unternehmen übernehmen diese Aufgabe professionelle Mitarbeiter, die häufig auch über eine kaufmännische Ausbildung verfügen. Am besten funktioniert also offenbar die Zusammenarbeit von guter Technik und erfahrenen Menschen, um aus staubigen Archivkästen nützliche Daten zu machen.