Computational Intelligence für die Analyse von Handschriften und Texten

Handschriften erkennen. Das CITlab war beteiligt an der „Virtuellen Forschungsumgebung“ Transkribus, einem Portal zur automatischen Erkennung von Handschriften. Die Textlesung wird dabei über Bildanalysen mittels KI realisiert und ist vor allem für Geisteswissenschaftler, Bibliotheken und Archive von großem Nutzen. Durch die Aufbereitung und Annotation des erkannten Textes können Informationen leichter und zudem automatisch erschlossen werden.

Dokumente klassifizieren. Durch die automatische Klassifikation von Texten und den darin vorkommenden Ereignissen und Personen wird das Verständnis natürlicher Sprachen verbessert. Eine Dokumentklassifikation ermöglicht es beispielsweise, Briefe so zu analysieren, dass eine automatische Sortierung und Zuordnung zu den zuständigen Mitarbeitenden erfolgt.

Bilder analysieren. Die Bildanalyse hat auch allgemein ein sehr breites Einsatzfeld. Durch die Auswertung von Messdaten, die in Bildern vorliegen, wird aktuell beispielsweise an Monitoring und Steuerung von Kernfusionsanlagen gearbeitet.

Kompetenzen im Bereich der künstlichen Intelligenz und Data Science

  • Erkennung von Hand- und Druckschriften
  • Natural Language Processing
  • Maschinelles Lernen

Prof. Dr. Roger Labahn

Lehrstuhl für Mathematische Optimierung, CITlab, Universität Rostock

Ausgewählte Projekte

NEISS: Neuronale Extraktion von Informationen, Strukturen und Symmetrien in Bildern

Im Projekt NEISS steht die Digitalisierung in diversen Wissensgebieten, insbesondere den Geisteswissenschaften, im Vordergrund. Hauptaugenmerk seitens CITlab ist die Extraktion und Analyse vielfältiger Informationen aus Bildern und Datenströmen. Speziell im Bereich der Digital Humanities wird die automatisierte Erschließung deutscher Texte mittels maschineller Lernverfahren erforscht.

Neben der reinen Erkennung von Texten spielt die semantische Interpretation des Erkannten, beginnend bei einzelnen Sätzen bis hin zu ganzen Büchern, eine entscheidende Rolle. Durch Methoden des Natural Language Processings, wie Topic Modelling, Sentiment Analysis und einer automatisierten Textzusammenfassung, können Texte und deren Bedeutung tiefer erschlossen werden. Durch die Kombination aus Texterkennung und künstlicher Intelligenz wird zudem die Qualität der erzielten Ergebnisse verbessert.

Weitere Informationen

NewsEye: A Digital Investigator for Historical Newspapers

Die Geisteswissenschaften stehen vor einer zunehmend wachsenden Datenfülle in Form sowohl analoger als auch digitaler Medien. Das Projekt NewsEye beschäftigt sich mit der Erforschung automatisierter Text- bzw. Artikelerkennungsverfahren sowie einer hybriden Annotation des erkannten Textes. Dabei werden zunächst durch Techniken des maschinellen Lernens Themen und Trends automatisiert erkannt und durch den Nutzer interaktiv verfeinert.

Der Schwerpunkt des EU-geförderten Projektes NewsEye liegt auf der Erschließung historischer Zeitschriften. Die entwickelten Methoden und Werkzeuge eröffnen neue Möglichkeiten zum Erschließen, Durchsuchen und Erforschen des digitalisierten, europäischen Kulturerbes.

Weitere Informationen