Forsche Forschung

Ihre AI-Assistenz fürs büro

Digitale Assistenten sind inzwischen allgegenwärtig – Siri ist in jedem iPhone, Amazon und Google integrieren die Funktionalität in ihre Geräte für zu Hause. Gemeinsam beantworten sie beinahe jede Frage, die man sich vorstellen kann. Beinahe jede Frage? Schauen wir mal genauer hin:

Wer ist unser Kanzler?
Olaf Scholz

Wer leitet unsere Vertriebsabteilung?
10 Tipps, um ein erstklassiges Vertriebsteam aufzubauen

Wie ist der aktuelle Händlerbestand für den X253?
United States Steel Corporation stieg gestern um 1,02$

Diese Assistenten sind Produkte für die Massen. Sobald man unternehmensinterne Informationen erfahren möchte, versagen sie. Grund genug, dass BettercallPaul sich des Themas annimmt.

Unser Forschungsprojekt mit der HDM Stuttgart

Gemeinsam mit dem Institute for Applied AI (IAAI) an der Hochschule der Medien Stuttgart gewannen wir eine Förderung für unser Forschungsprojekt im Rahmen des Zentralen Innovationsprogramms Mittelstand (ZIM) des Bundesministeriums für Wirtschaft und Energie (BMWi). Darüber hinaus investiert BettercallPaul eigene Mittel und eigene Mitarbeiter:innen. Ziele des Forschungsprojektes sind:

Entwicklung verschiedener KI- und Integrations-Komponenten eines Wissens-Assistenten für Industrie- und Gesellschaftsanwendungen im deutschsprachigen Raum.
Analyse und Entwicklung von Methoden zur Reduktion der notwendigen Datensätze für die Anwendung von XNEXT auf wenige Dutzend im Gegensatz zu zehntausenden Einträgen in üblichen Deep Learning-Szenarien
Analyse und Entwicklung von Methoden zur Extraktion von strukturiertem Wissen aus unstrukturierten Textdaten
Rückverfolgbarkeit der Quellen für die Informationsausgabe
Möglichst hohe Präzision bei der Beantwortung von Fragen

Komponenten

XNEXT ist eine Blaupause, die mehrere Komponenten eines Frage-Antwort-Systems für Unternehmensinformationen umfasst.

Basis ist ein auf Daten des Unternehmens trainiertes Sprachmodell, das Fachbegriffe korrekt erkennen und verarbeiten kann. Die Komponente DeepFind kann damit eine natürlich geschriebene Frage (z. B. „Wo muss ich meine Reisekostenabrechnung einreichen?“) interpretieren und in Dokumenten nach passenden Antworten suchen (z.B. „reisekosten@bcxp.de“).

Dazu kommt DBFind, ein auf die Suche in strukturierten Daten spezialisiertes neuronales Modell. Mit DBFind wandeln wir natürliche Fragen in Datenbank-Anfragen um und können den Inhalt neuer oder bestehender Datenbanken mit in die Ergebnisse einfließen lassen.

Schließlich wollen wir mit dem letzten neuronalen Modell WideFind ein aktuelles Forschungsthema aufgreifen, um herauszufinden, ob eine direkte neuronale Verarbeitung der Dokumente Vorteile für die Suche bringt (ähnlich zum bekannten GPT-3-Modell).

Die letzte Komponente XFind integriert die drei Pfade und generiert eine passende, zusammengefasste Antwort.

Wir sind bereits in der Lage, unseren Kunden die ersten Ergebnisse der Forschung zu zeigen. Wir hoffen, wenn die Zeit dafür reif ist, einen öffentlichen Link auf ein System freigeben zu können, das mit öffentlichen Daten trainiert wurde. Damit könnte sich jeder einen eigenen Eindruck zu den Ergebnissen machen.

Technologie

Aufmerksame Leser dieses Blogs werden sich an unsere Systeme HeXX und FrAn erinnern und wissen, dass wir seit langem in der Forschung und Implementierung von natürlichsprachlichen Systemen aktiv sind. Auf dieser Basis haben wir ein gutes Verständnis der aktuellen Forschung – Stichwort Transformer – und wir verwenden sowohl BERT-Modelle als auch generative Modelle in XNEXT.

Herausforderungen

Als deutsches Unternehmen war uns klar, dass XNEXT die deutsche Sprache beherrschen muss. Das ist kein triviales Unterfangen, da die meiste Forschung und die Erstellung öffentlich zugänglicher Datensets im englischen oder chinesischen Sprachraum stattfinden. Teilweise haben wir eigene Werkzeuge bauen müssen, um englische Daten zu übersetzen und in eine Form zu bringen, die für unsere deutschen Modelle passt. Das wäre jedoch nicht ausreichend gewesen, hätten wir nicht die Unterstützung unserer Kooperationspartner, die eigene deutsche Datensets mit in die Kooperation brachten.

Kooperationspartner

Mit den gesteckten Zielen war es uns wichtig XNEXT mit betrieblichen Echtdaten zu trainieren. Zum Glück haben wir sehr schnell die Stadtwerke München und die Landeshauptstadt München als Kooperationspartner gewinnen können, die das Projekt sowohl mit Daten als auch mit engagierten Mitarbeiter:innen unterstützen. Zusätzlich sind wir in Abstimmungen mit weiteren Unternehmen.

Ethik

Ein KI-Modell spiegelt immer die Voreingenommenheit der Daten wider, womit es trainiert wird. Es bedarf besonderes Augenmerk, um ein Modell zu erzeugen, welches unseren Ansprüchen an Gleichberechtigung genügt oder übertrifft. Genau die Werkzeuge, die wir zum Erzeugen von Trainingsdaten bauen, wollen wir ausweiten, um gerechtere und gleichere Voraussetzungen für das Modelltraining zu schaffen.

Institute for applied ai

Ziel des IAAI ist es, KI in die Anwendung zu bringen. Um die Lücke zwischen Forschung, Unternehmen und Gesellschaft zu schließen, bündelt das Institut die KI-Kompetenz der Hochschule in einem interdisziplinären Zusammenschluss von Professorinnen, Forscherinnen und HdM-Partnern. Die Forschungs- und Entwicklungsprojekte des IAAI erstrecken sich über verschiedene Teilbereiche der Künstlichen Intelligenz und Data Science. Der gemeinsame Nenner ist dabei der Fokus auf die Anwendungsseite.

Landeshauptstadt München

Die Stadt München beteiligt sich über das InnovationLab des stadteigenen Dienstleisters it@M an dem Forschungsprojekt. Ziel ist es die Möglichkeiten KI-basierter Suchen für verwaltungsspezifische Dokumente zu evaluieren, um so den Bürger:innen einen einfachen Zugang zu Informationen zu ermöglichen.

Stadtwerke München

Für die Stadtwerke München bietet eine übergreifende semantische Suche in den verschiedenen unternehmensinternen Systemen einen großen Mehrwert. Die Ergebnisse aus XNEXT können hier helfen, Systemsilos zu überwinden und relevantes Wissen allen Mitarbeitern zugänglich zu machen.

Über die Autoren

David Jenkins
Inselflüchtig wurde David Jenkins bereits 1985 – seitdem lebt er mit seiner Familie in und um München. Seine Laufbahn umfasste alles von Echtzeit-Embedded-Programmen, CAD-Software, Preismodellen für Finanzinstrumente bis hin zur Fahrzeugteileprognose. Seit dem Studium mathematisch interessiert, treibt er die KI-Aktivitäten von BettercallPaul in München voran. Und dass sein Sohn Gegengifte für Schlangentoxine erforscht, findet er cool.

Clemens Gutknecht
Clemens ist ein „Deep-Learning-Native“. Schon im Bachelorstudium „Cognitive Science“ von KI-Vorlesungen begeistert, entschied er sich für den Master in Machine Learning. Zunächst viel im Computer-Vision-Bereich unterwegs, entdeckte er mit der Masterthesis die faszinierenden Möglichkeiten des Natural Language Processing (NLP). Diese Leidenschaft passte perfekt zum Forschungsprojekt XNext bei BettercallPaul, dessen Leitung Clemens nun übernimmt.

Leon Schröder (IAAI)
Leon programmiert und trainiert tiefe neuronale Netze seit circa 2012. Angefangen hat es mit der Vorhersage der Stromproduktion von Windkraft- und Solaranlagen. Bald folgte die Vorhersage von Wolkenbewegungen mithilfe von Convolutional Neural Networks (CNNs) und die automatische Erkennung von gefährdeten Vogelarten in Bildmaterial. Den Einstieg ins IAAI machte Leon 2019 und beteiligte sich an der Forschung zur Trennung von Signalen in Audiodaten. Im gemeinsamen Forschungsprojekt mit BettercallPaul freut sich Leon mit wahrhaft exzellenten Kollegen zusammen arbeiten zu dürfen.

Weitere Informationen

Wünschst du weitere Informationen zum Thema XNEXT oder KI bei BettercallPaul? Schreib mir gerne eine E-Mail: sayhi@bcxp.de. Ich freue mich auf deine Kontaktaufnahme.

#KünstlicheIntelligenz