Auf einen Chat mit Firmendaten

Datenbankabfrage im Handumdrehen, in natürlicher Sprache und ohne komplexe Programmier-kenntnisse: Dank der Verknüpfung von Sprach-KIs mit Big-Data-Technologien macht der LLM In-sight Expert das möglich
Datenbankabfrage im Handumdrehen, in natürlicher Sprache und ohne komplexe Programmier-kenntnisse: Dank der Verknüpfung von Sprach-KIs mit Big-Data-Technologien macht der LLM In-sight Expert das möglichBild: © KI.NRW

„Welche Kundengruppe hat in den vergangenen beiden Sommern unser Produkt am häufigsten erworben? Haben im deutschen Sprachraum Sonderangebote eine Rolle dabei gespielt?“ Solche Fragen sollen etwa Sales-Mitarbeiterinnen künftig einfach in natürlicher Sprache in das Chat-Feld eines Large Language Models (LLM) eingeben können. Als Antwort könnten sie eine grafische Aufbereitung von Trends, Mustern und Korrelationen erhalten, die als Grundlage neuer Werbeaktionen dient. Mit dem LLM Insight Expert, das am Fraunhofer Cluster of Excellence Cognitive Internet Technologies CCIT entsteht, sollen auch IT-Laien derartige datenbasierte Analysen anstellen können: Die KI-Technologie übernimmt automatisiert Aufgaben, für die bislang Such-, Verknüpfungs- und Programmierarbeit notwendig war.

Datenchaos wird zum Kostenfaktor

„Gerade in größeren Unternehmen fehlt oft der Überblick über den gesamten Data Lake, in dem – verteilt auf verschiedene Standorte und Systeme – relevantes Wissen vorhanden ist“, sagt Tasneem Tazeen Rashid, Research Engineer am Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS. Das Institut hat das KI-System mit der Kompetenzplattform KI.NRW federführend im Rahmen eines Projekts des Fraunhofer CCIT entwickelt.

Chat-KI als Übersetzerin

Der LLM Insight Expert erstellt eine virtuelle Datenbank und verbindet sie mit einem Large Language Model, das natürlicher Sprache verstehen und aus den Datenquellen Text und Grafiken erstellen und verarbeiten kann. Das Large Language Model sammelt Metadaten aus verschiedenen Datenquellen, die im Unternehmen verwendet werden (etwa CSV, Parquet, MongoDB, Cassandra oder MySQL), und mappt in ein einheitliches Format. Diese virtuelle Datenbank kann von einer Big-Data-Technologie wie Spark verarbeitet werden. So kann das LLM komplexe Fragen in standardisierte SPARQL-Abfragen übersetzen. Anschließend überführt das LLM die Ergebnisse zurück in natürliche Sprache und Visualisierungen wie beispielsweise Graphen oder Diagramme.