Handschriften erkennen. Das CITlab war beteiligt an der „Virtuellen Forschungsumgebung“ Transkribus, einem Portal zur automatischen Erkennung von Handschriften. Die Textlesung wird dabei über Bildanalysen mittels KI realisiert und ist vor allem für Geisteswissenschaftler, Bibliotheken und Archive von großem Nutzen. Durch die Aufbereitung und Annotation des erkannten Textes können Informationen leichter und zudem automatisch erschlossen werden.
Dokumente klassifizieren. Durch die automatische Klassifikation von Texten und den darin vorkommenden Ereignissen und Personen wird das Verständnis natürlicher Sprachen verbessert. Eine Dokumentklassifikation ermöglicht es beispielsweise, Briefe so zu analysieren, dass eine automatische Sortierung und Zuordnung zu den zuständigen Mitarbeitenden erfolgt.
Bilder analysieren. Die Bildanalyse hat auch allgemein ein sehr breites Einsatzfeld. Durch die Auswertung von Messdaten, die in Bildern vorliegen, wird aktuell beispielsweise an Monitoring und Steuerung von Kernfusionsanlagen gearbeitet.
Kompetenzen im Bereich der künstlichen Intelligenz und Data Science
- Erkennung von Hand- und Druckschriften
- Natural Language Processing
- Maschinelles Lernen
Prof. Dr. Roger Labahn
Lehrstuhl für Mathematische Optimierung, CITlab, Universität Rostock
Ausgewählte Projekte
NEISS: Neuronale Extraktion von Informationen, Strukturen und Symmetrien in Bildern
Im Projekt NEISS steht die Digitalisierung in diversen Wissensgebieten, insbesondere den Geisteswissenschaften, im Vordergrund. Hauptaugenmerk seitens CITlab ist die Extraktion und Analyse vielfältiger Informationen aus Bildern und Datenströmen. Speziell im Bereich der Digital Humanities wird die automatisierte Erschließung deutscher Texte mittels maschineller Lernverfahren erforscht.
Neben der reinen Erkennung von Texten spielt die semantische Interpretation des Erkannten, beginnend bei einzelnen Sätzen bis hin zu ganzen Büchern, eine entscheidende Rolle. Durch Methoden des Natural Language Processings, wie Topic Modelling, Sentiment Analysis und einer automatisierten Textzusammenfassung, können Texte und deren Bedeutung tiefer erschlossen werden. Durch die Kombination aus Texterkennung und künstlicher Intelligenz wird zudem die Qualität der erzielten Ergebnisse verbessert.
NewsEye: A Digital Investigator for Historical Newspapers
Die Geisteswissenschaften stehen vor einer zunehmend wachsenden Datenfülle in Form sowohl analoger als auch digitaler Medien. Das Projekt NewsEye beschäftigt sich mit der Erforschung automatisierter Text- bzw. Artikelerkennungsverfahren sowie einer hybriden Annotation des erkannten Textes. Dabei werden zunächst durch Techniken des maschinellen Lernens Themen und Trends automatisiert erkannt und durch den Nutzer interaktiv verfeinert.
Der Schwerpunkt des EU-geförderten Projektes NewsEye liegt auf der Erschließung historischer Zeitschriften. Die entwickelten Methoden und Werkzeuge eröffnen neue Möglichkeiten zum Erschließen, Durchsuchen und Erforschen des digitalisierten, europäischen Kulturerbes.