Ein Beitrag von Prof. Dr. Jürgen Angele und Dr. Thomas Franz
Textverarbeitung als Use Case in der KI
Ein „Parsen“, sprich ein Analysieren der Sätze, lässt die Struktur eines Satzes erkennen und ermöglicht die Zuordnung von Rollen wie Substantiv, Prädikat und Objekt. Die Erkennung von Entitytypen erlaubt die Zuordnung von Satzteilen zu Kategorien wie Person, Lokation oder Firmenname. Die Extraktion von Relationen ermöglicht es, Beziehungen in Texten zwischen Entitites zu erkennen. Im Gegensatz zu solchen tiefen Analysen bedient sich Textmining statistischer Methoden, um beispielsweise wichtige Worte in Texten zu extrahieren und Texte zu klassifizieren.
Anwendungsbeispiele
Üblicherweise nutzen komplexe Systeme unterschiedliche Methoden der Künstlichen Intelligenz. Exemplarisch ist folgender Use Case aus dem Bankenumfeld, der Methoden aus verschiedenen Bereichen der KI nutzt:
Servicebereich: Banking
Bankinterne Berater unterstützen ihre Fondsmanagement-Kollegen bei Anlageentscheidungen. Dafür lesen sie Berichte von Analysten, die beispielsweise die Entwicklung von Industriebereichen in unterschiedlichen Regionen betrachten. Um nicht alle derartigen Berichte lesen zu müssen und das Wissen dazu dennoch flexibel und in natürlicher Weise abgreifen zu können, sollen die Berichte in Zukunft einerseits automatisch analysiert und die Inhalte andererseits in Form einer natürlichen Sprachkommunikation zur Verfügung gestellt werden. Das System muss in der Lage sein, alle Entscheidungen nachvollziehbar zu dokumentieren. In einem solchen Bericht ist beispielsweise folgender Satz zu finden: „Das Wachstum in China hat sich etwas beschleunigt. Es beträgt voraussichtlich 6,3 Prozent in diesem Jahr.“ Mit Hilfe von Methoden des NLP wird der Text analysiert und Informationen extrahiert, die maschinell verarbeitet werden können. Diese Informationen werden in ein Wissensrepräsentationssystem eingespeist. Dieses enthält ein komplexes Modell, das mittels Schlussfolgerungen Anlageentscheidungen vorschlagen kann.
Eine Erklärungskomponente macht die Anlageentscheidung im Detail nachvollziehbar. Wenn nun eine Anlageempfehlung gefordert ist, wird das Sprachsignal in einen Text übersetzt. Die Systeme großer Anbieter wie Alexa, Google Home, Siri und Cortana nutzen Verfahren, um Sprache in Text umzusetzen. Zum Trainieren dieser Systeme wird meist Deep Learning auf Basis von neuronalen Netzen angewandt. Das Ergebnis dieser Umsetzung könnte die Aufforderung „Gib mir bitte eine aktuelle Anlageempfehlung“ als Text sein. Dieser Text wird durch NLP-Verfahren analysiert und einem „Intent“, einer konkreten Zielsetzung, zugeordnet.
Ein Intent drückt die Absicht einer solchen Aufforderung oder Frage aus und ist eine maschinenlesbare Information. Einem Intent können viele unterschiedliche Formulierungen zugeordnet werden. Das Wissensrepräsentationssystem erzeugt aus dem Intent die Anlageempfehlung, die dann vorgelesen wird. Wir sehen, dass dieses System Methoden des Natural Language Processing (NLP), der Wissensrepräsentation, von Schlussfolgerungen und des Maschine Learning (Neuronale Netze, Deep Learning) kombiniert, um die geforderte Funktionalität zur Verfügung zu stellen.