Probabilistic Programming – ein neuer Baustein für das maschinelle Lernen

Ein neuer KI-Baustein. In der klassischen Programmierung werden Eingabedaten mittels Anweisungen zu einer Ausgabe überführt. Im Gegensatz dazu erlernen überwachte maschinelle Lernverfahren auf Basis von Ein- und Ausgabedaten selbstständig eine Vorschrift, wie die Eingaben zu den Ausgaben überführt werden. Prof. Wengerek beschäftigt sich in seiner Forschung mit der dritten möglichen Variante: Wenn sowohl der Algorithmus als auch die Ausgaben bekannt sind, wie sehen dann die dazugehörigen Eingaben aus?

Wenig Daten? Dann schlau raten! Wenn statt riesiger Datenmengen nur wenige Daten, dafür aber ein anwendungsbezogenes Modell für die Erzeugung der Ausgabedaten zur Verfügung steht, kann dieses Modell „invertiert“ werden. Dadurch werden passende Werte für die Eingaben des Modells bestimmt, welche die gewünschten Ausgaben erzeugen. Als Modelle können beispielsweise vorhandene Simulationen oder probabilistische Programmiersprachen genutzt werden.

 Bayesianische Inferenz. Probabilistische Programmiersprachen sind derart ausdrucksstark, dass sich mit ihnen das Modell – beispielsweise in Form von Bedingungen an die Daten oder als Vorwissen des Anwenders – als ein Programm formulieren lassen. Die Ausführung dieses Programms erzeugt dann Stichproben der statistischen Verteilung der gesuchten Modellparameter. Prof. Wengerek exploriert durch moderne Algorithmen diese Verteilung und interpretiert diese anschließend für den jeweiligen Anwendungszweck. Durch die Einbindung tiefer, neuronaler Netze zum „Deep Probabilistic Programming“ werden so auch komplexere Probleme lösbar.

Das Video zeigt den Einsatz von Probabilistic Programming zu Lösen eines komplexen Physik-Rätsels. Ziel ist es, durch das Platzieren von Sprungstufen möglichst viele Bälle in den Korb auf der rechten Seite zu lenken. Die Bälle rollen von der Rampe herunter und treffen auf ein zufällig platzierte Sprungstufen und prallen dort ab. Wie müssen diese Sprungstufen platziert werden, damit möglichst viele Bälle im Korb (unten rechts) landen? Zusätzliche Hindernisse und Wechselwirkungen der Bälle untereinander erschweren das Finden einer Lösung. Durch Inferenzalgorithmen des Probabilistic Programming kann das Rätsel gelöst werden.

Vielfältig einsetzbar. Insgesamt eröffnet das Feld des Probabilistic Programming für viele Anwendungsgebiete ungeahnte Möglichkeiten, denn häufig sind eben keine riesigen Datenmengen verfügbar, um Vorhersage- oder Entscheidungsprobleme zu lösen. Beispielsweise lassen sich Strategieplanungen zur Bekämpfung von Pandemien mittels Probabilistic Programming erarbeiten, noch bevor es zu einer Verschärfung der Lage kommt. Weitere Anwendungsgebiete umfassen Regelungsaufgaben nd Fragestellungen aus der Kognitionsforschung, aber auch die Bereinigung fehlerhafter Datensätze.

Geregelte Wissensverarbeitung. Als zweiten Forschungsschwerpunkt untersucht Prof. Wengerek den Einsatz von Expertensystemen für SoftwareentwicklerInnen. Normalerweise kommen Expertensystemen in klar eingegrenzten Anwendungsfeldern zum Einsatz, um mittels Schlussfolgerungen auf vorhandenen Erfahrungen neues Wissen zu generieren. Durch den Fokus auf die Softwareentwicklung lässt sich das dort gesammelte Wissen in viele Anwendungsfelder einbeziehen und nutzen.

Kompetenzen im Bereich der künstlichen Intelligenz und Data Science

  • Probabilistic Programming
  • Regel-basierte Wissensverarbeitung

Prof. Dr. rer. nat. Thomas Wengerek

Wirtschaftsinformatik, Hochschule Stralsund