Big Data Analytics: Datenanalyse im großen Stil

Schnellere Datenanalysen. Machine-Learning-Verfahren beruhen auf der vorherigen Sammlung einer großen Menge an Daten. Die im Alltag eingesetzten Computer stoßen dabei schnell an Performance-Probleme. Zur Überwindung dieser Hindernisse werden Verfahren zur parallelen Datenverarbeitung eingesetzt. Am Lehrstuhl von Prof. Heuer werden in diesem Rahmen Techniken zur transparenten Datenbankunterstützung für Big Data Analytics erforscht.

Rückverfolgbarkeit von Informationen. Die Hauptaufgaben des Forschungsdatenmanagements sind die Sammlung, Auswertung, Analyse, Archivierung und Veröffentlichung von Forschungsdaten. Verschiedene Forschungseinrichtungen weltweit produzieren diese Forschungsdaten in großen Mengen. Durch den Einsatz von Data Provenance wird die Verarbeitung, Analyse und Speicherung dieser Daten erheblich unterstützt. Data Provenance bedeutet, dass von den Analyseergebnissen aus die relevanten Originaldaten gefunden werden können und damit die Analyseergebnisse reproduzierbar werden.

Datenschutz im Internet der Dinge sicherstellen. Smart Metering, Bewegungsprofile, biometrische Datenbanken: In unserer digitalen Welt werden stetig mehr Informationen über uns gesammelt. Dabei werden unter Umständen auch Angaben über unsere persönlichen Verhältnisse erfasst, ohne dass wir unsere Zustimmung erteilt haben. Bei der Entwicklung von Informationssystemen ist darauf zu achten, dass diese Systeme nicht nur smart, sondern auch privatsphäre-sichernd sind. Dies wird durch eine dezentrale und damit datensparsame Daten- und Anfrageverarbeitung erreicht.

Kompetenzen im Bereich der künstlichen Intelligenz und Data Science

  • Parallele Anfrageverarbeitung auf großen, teils heterogenen Datenbeständen
  • Unterstützung des Forschungsdatenmanagements durch Techniken der Data Provenance
  • Realisierung datenschutzfreundlicher Informationssysteme durch Anonymisierungsverfahren und Anfragetransformationen

Prof. Dr. Andreas Heuer

Lehrstuhl Datenbank- und Informationssysteme, Universität Rostock

Ausgewählte Projekte

PArADISE: Big Data und der Datenschutz

Im Rahmen des PArADISE-Frameworks werden Entwickler von smarten Systemen bei der Entwicklung und dem Deployment von smarten Systemen unterstützt. Während der Entwicklungsphase werden komplexe Machine-Learning-Algorithmen als SQL-Anfragen dargestellt und gleichzeitig für die Parallelisierung umgeformt.

Nach Auswahl geeigneter Datenquellen werden die Anfragen hinsichtlich ihres Zugriffs auf personenbezogene Daten untersucht und ggf. für die Berechnung ihres Anfrageergebnisses verteilt. Dabei werden die Anfragen derart transformiert, dass leistungsschwache Geräte, wie Sensoren oder Kleinstrechner, bereits einen Teil der Analyse übernehmen, so dass nur vorgefilterte und voraggregierte Ergebnisse auf einem zentralen (Cloud-)Server landen.

ProSA: Provenance Management durch Schema-Abbildungen

Durch eine Kombination aus dem CHASE – einem universellen Werkzeug zur Transformation von Datenbanken oder Anfragen in Datenbanksystemen  und Data Provenance wird eine minimale Teildatenbank der ursprünglichen Forschungsdaten berechnet, so dass die Minimierung von Forschungsdaten  eines der Hauptprobleme des Forschungsdatenmanagements – realisiert wird. 

Weiterhin werden folgende Fragen im Rahmen des Forschungsdatenmanagement beantwortet: (1) Woher kommen die Daten? (2) Warum kommt dieses Ergebnis zustande? (3) Wie wird das Ergebnis berechnet? Die Ergebnisse im Bereich Forschungsdatenmanagement und Data Provenance werden in einem Kooperationsprojekt der Universität Rostock und des Leibniz-Instituts für Ostseeforschung Warnemünde (IOW) angewendet.