Home

Rixdorfer-Predigten

„Rixdorfer-Predigten“ – Handschriftenidentifikation und linguistische Autorenerkennung

Das Institut für Slawistik der Humboldt-Universität zu Berlin untersucht aus dem 18. Jahrhundert überlieferte tschechischsprachige Handschriften aus Böhmisch-Rixdorf in Berlin und möchte mit Hilfe von computergestützten Analyseprogrammen herausfinden, wie sich Sprachwandel und kultureller Austausch daran nachweisen lassen. Gefördert wird das interdisziplinäre Forschungsprojekt von der Volkswagenstiftung im Rahmen der Initiative „Mixed Methods“ in den Geisteswissenschaften

Rund 5.000 Seiten, handschriftlich verfasst, entstanden zwischen 1740 und 1830 – Dokumente, die das Leben einer kleinen, ursprünglich tschechischsprachigen Gemeinde von Glaubensflüchtlingen aus Böhmen festhalten. Hintergrund ist die Flucht von rund 350 hussitischen Gläubigen aus Ostböhmen, die ab 1737 eine neue Heimat in Berlin-Rixdorf fanden. Deren Aufzeichnungen werden in einem Archiv in Berlin-Neukölln verwahrt.

Im Zusammenwirken beider Methodenstränge – Textwissenschaft und Bild-/Mustererkennung – sollen aussagekräftige Merkmale für die folgenden Aufgabenfelder gefunden und erprobt werden:

  • Schreiberidentifikation in einer großen Zahl von handschriftlichen Texten
  • Aufdecken von textgeschichtlichen Schichten durch Schreiberdifferenzierung
  • Auffinden und Quantifizieren von wiederkehrenden Textstücken
  • Identifikation von textgeschichtlich wichtigen Schriftmerkmalen

Im Fokus der Aufgabe für die MusterFabrik Berlin steht dabei die Entwicklung von Verfahren zur Analyse der Kontext-spezifischen Struktur von Bildmustern in den digitalisierten Handschriften zur Ableitung von qualitativen Aussagen über die Autoren und den Inhalt der Predigten.

Dazu sollen durch Entwicklung und Anwendung von Verfahren der Künstlichen Intelligenz in den Digitalisaten wiederkehrende Bildmuster wie beispielsweise Kontextverkettungen in Form von Buchstaben, Wörtern oder auch Satz-Phrasen detektiert und deren positionsbezogenes Vorkommen strukturell erfasst werden. Daraus soll ein sogenanntes strukturiertes Netzwerk von Bildmustern abgeleitet werden, welches die detektierten wiederkehrenden Bildmuster, deren Anzahl sowie deren positionsbezogene Verknüpfung untereinander beschreibt. Darauf basierend soll im Anschluss in Zusammenarbeit mit den Experten der Humboldt-Universität zu Berlin eine qualitativ-inhaltliche Analyse der Handschriften durchgeführt werden. Dabei sollen die vorab mit Hilfe der Verfahren des maschinellen Lernens automatisch ermittelten kontextspezifischen Zusammenhänge dahingehend analysiert werden, ob aus diesen qualitative Aussagen abgeleitet werden können.

Für eine solche Struktur-Analyse sollen in einem ersten Schritt geeignete Bildmerkmale für eine strukturelle Auswertung ermittelt werden. Darauf aufbauend soll ein Modul zur Detektion von Bildmustern entwickelt werden. Zudem sollen Verfahren des maschinellen Lernens zur positionsbezogenen Verknüpfung und zur kontextspezifischen Analyse entwickelt werden. Abschließend soll in Zusammenarbeit mit Mitarbeitern der Humboldt-Universität zu Berlin eine qualitative Analyse durchgeführt werden, hinsichtlich der Möglichkeit, qualitative Aussagen aus den ermittelten Ergebnissen ableiten zu können.

Das Projekt wird von der Volkswagen Stiftung gefördert:

 

 

Projektpartner

Über Uns