Automatisierte Handschriftenerkennung

transcriptorium

Ein Scanner bzw. ein entsprechendes Programm können einen gedruckten oder maschingeschriebenen Text so erfassen, dass der Text etwa als Worddokument weiter verarbeitet werden kann (OCR = Optical Character Recognition,Texterkennung). Das hat den Vorteil, dass man zum Beispiel in großen Texten gezielt suchen oder einen OCR-digitalisierten Zettelkatalog in ein Bibliotheksprogramm einspeisen kann.
Wenig Erfolg gab es bislang bei der automatisierten Texterkennung von Handschriften. Zu vielfältig sind die unterschiedlichen Schreibweisen der einzelnen Buchstaben, als dass eine Maschine sie eindeutig lesen könnte. Das soll sich jetzt ändern. Im EU-Projekt tranScriptorium, an dem unter anderem auch das Institut für Germanistik der Universität Innsbruck beteiligt ist, will man bis 2016 einen Prototyp für eine Software zur automatisierten Erkennung historischer Handschriften entwickeln. Vielversprechende Anfänge kann man auf der Website des Projekts schon selbst ausprobieren. Wer mehr wissen will, kann an einem Workshop am 24.2.2015 im Rahmen der Tagung Digital Humanities in Graz teilnehmen.

Farbbalken