placeholder

Forschungsprojekt OpenGPT-X veröffentlicht großes KI-Sprachmodell

Bild: ©flyalone/stock.adobe.com
Das Diagramm zeigt die zusätzliche Rechenleistung, die erforderlich ist, um einen nicht-englischen Text mit dem zu dem Sprachmodell zugehörigen Tokenizer zu verarbeiten (in % im Vergleich zu Llama 3). – Bild: ©Fraunhofer IAIS

Das große KI-Sprachmodell des Forschungsprojekts OpenGPT-X steht ab sofort auf Hugging Face zum Download bereit: ‚Teuken-7B‘ wurde von Grund auf mit den 24 Amtssprachen der EU trainiert und umfasst sieben Milliarden Parameter. Akteure aus Forschung und Unternehmen können das kommerziell einsetzbare Open-Source-Modell fu?r ihre eigenen Anwendungen der ku?nstlichen Intelligenz (KI) nutzen. Damit haben die Partner des vom Bundesministerium für Wirtschaft und Klimaschutz (BMWK) geförderten Konsortialprojekts OpenGPT-X unter der Leitung der Fraunhofer-Institute fu?r Intelligente Analyse- und Informationssysteme IAIS und fu?r Integrierte Schaltungen IIS ein großes KI-Sprachmodell als frei verwendbares Open-Source-Modell mit europäischer Perspektive auf den Weg gebracht.

„Im Projekt OpenGPT-X haben wir in den vergangenen zwei Jahren mit starken Partnern aus Forschung und Wirtschaft die grundlegende Technologie fu?r große KI-Fundamentalmodelle erforscht und entsprechende Modelle trainiert. Wir freuen uns, dass wir jetzt unser Modell weltweit frei zur Verfu?gung stellen und damit eine aus der öffentlichen Forschung stammende Alternative fu?r Wissenschaft und Unternehmen bieten können“, sagt Prof. Dr. Stefan Wrobel, Institutsleiter am Fraunhofer IAIS. „Unser Modell hat seine Leistungsfähigkeit u?ber eine große Bandbreite an Sprachen gezeigt, und wir hoffen, dass möglichst viele das Modell fu?r eigene Arbeiten und Anwendungen adaptieren oder weiterentwickeln werden. So wollen wir sowohl innerhalb der wissenschaftlichen Community als auch gemeinsam mit Unternehmen unterschiedlicher Branchen einen Beitrag leisten, um den steigenden Bedarf nach transparenten und individuell anpassbaren Lösungen der generativen künstlichen Intelligenz zu adressieren.“

Multilingual entwickelt

Teuken-7B ist eines der wenigen KI-Sprachmodelle, die von Grund auf multilingual entwickelt wurden. Es enthält ca. 50 Prozent nicht-englische Pretraining-Daten und wurde in allen 24 europäischen Amtssprachen trainiert. Die Projektbeteiligten sehen darin etwa Möglichkeiten für internationale Unternehmen mit mehrsprachigen Kommunikationsbedarfen sowie Produkt- und Serviceangeboten. Die Bereitstellung als Open-Source-Modell erlaubt es Unternehmen und Organisationen, eigene angepasste Modelle in realen Anwendungen zu betreiben. Sensible Daten können im Unternehmen verbleiben.

Präzise 2D-Inspektion mit nativer Edge-Intelligenz

In der industriellen Bildverarbeitung stellen PC-basierte Systeme oft eine technische Hürde dar. Die Trennung von Bildaufnahme und Datenverarbeitung führt häufig zu Latenzen, erhöhtem Platzbedarf und einem komplexen Wartungsaufwand. Besonders in schnellen Produktionslinien erschwert die Synchronisation zwischen Sensor und externem Rechner eine stabile Prozesskontrolle. ‣ weiterlesen

Prof. Dr.-Ing. Bernhard Grill, Institutsleiter am Fraunhofer IIS, betont die Bedeutung für sicherheitsrelevante Anwendungen: „Mit dem hier veröffentlichten, von Grund auf vollkommen eigenständig trainierten Sprachmodell demonstrieren die Projektpartner ihre Fähigkeit, eigene große Modelle erzeugen zu können. Der damit verbundene Zugriff auf ein großes KI-Sprachmodell ermöglicht Anwendungen, die ohne nicht einsehbare Fremd-Komponenten eine sehr viel bessere Kontrolle über diese Technologie bieten – zum Beispiel für spezifische, besonders auch sicherheitskritische Anwendungen im Automobilbereich, in der Robotik, der Medizin oder dem Finanzwesen. Durch Training mit den für den konkreten Anwendungsfall relevanten Daten und die Verwendung anwendungsspezifischer Architekturen können für Unternehmen so individuelle KI-Lösungen geschaffen werden, die ohne Black-Box-Komponenten auskommen.“

Das OpenGPT-X-Team widmete sich neben dem Modelltraining auch zahlreichen Forschungsfragen, zum Beispiel wie multilinguale KI-Sprachmodelle energie- und kosteneffizienter trainiert und betrieben werden können. Dazu wurde im Projekt ein multilingualer ‚Tokenizer‘ entwickelt. Dessen Aufgabe ist es, Wörter in einzelne Wortbestandteile zu zerlegen – je weniger Token, desto (energie-)effizienter und schneller generiert ein Sprachmodell die Antwort. Wie die Forschenden mitteilen, führte die Entwicklung zu einer Reduzierung der Trainingskosten im Vergleich zu anderen multilingualen Tokenizern, wie etwa Llama3 oder Mistral. Dies komme insbesondere bei europäischen Sprachen mit langen Wörtern wie Deutsch, Finnisch oder Ungarisch zum Tragen, so die Beteiligten. Auch im Betrieb von mehrsprachigen KI-Anwendungen können damit Effizienzsteigerungen erreicht werden.

Gaia-X-kompatibel

Das Verbundprojekt OpenGPT-X wurde im Rahmen des BMWK-Förderprogramms ‚Innovative und praxisnahe Anwendungen und Datenräume im digitalen Ökosystem Gaia-X‘ gefördert. Somit ist Teuken-7B auch u?ber die Gaia-X Infrastruktur zugänglich. Akteure im Gaia-X-Ökosystem können so Sprachanwendungen entwickeln und in konkrete Anwendungsszenarien in ihren jeweiligen Domänen überführen.

In die Modellentwicklung sind wichtige Forschungsergebnisse aus dem OpenGPT-X-Projekt eingeflossen, wie beispielsweise Tools und Technologien, um sehr große Datenmengen aufzubereiten, leistungsfähige europäische HPC-Infrastrukturen zu nutzen und ein effizientes Modelltraining durchzuführen. Trainiert wurde Teuken-7B mithilfe des Supercomputers Juwels am Forschungszentrum Ju?lich. Neben den beiden Fraunhofer-Instituten und dem Forschungszentrum Ju?lich haben der KI Bundesverband, die TU Dresden, das Deutsche Forschungszentrum fu?r Ku?nstliche Intelligenz (DFKI), Ionos, Aleph Alpha, ControlExpert sowie der Westdeutsche Rundfunk (WDR) als Partner an OpenGPT-X mitgearbeitet. Die in OpenGPT-X entstandene Technologie bietet den Partnern auch zuku?nftig die Basis fu?r das Training weiterer eigener Modelle.

Das Anfang 2022 gestartete Forschungsprojekt steht nun kurz vor dem Abschluss. Es läuft noch bis zum 31. März 2025, so dass weitere Optimierungen und Evaluierungen der Modelle erfolgen können.

Thematik: Allgemein

Fraunhofer-Gesellschaft

Zur Firmenwebsite

MEHR ZUM THEMA

Bild: Infineon Technologies AG

Infineon und Nvidia bauen Zusammenarbeit aus

Bild: Colnago

Rapid.Tech 3D zeigt Anwendungen für die Mobilitätsbranche

Bild: Industrial Digital Twin Association e.V.

IDTA und IDSA arbeiten zusammen

Anzeige

Bild: LMI Technologies GmbH

Präzise 2D-Inspektion mit nativer Edge-Intelligenz

In der industriellen Bildverarbeitung stellen PC-basierte Systeme oft eine technische Hürde dar. Die Trennung von Bildaufnahme und Datenverarbeitung führt häufig zu Latenzen, erhöhtem Platzbedarf und einem komplexen Wartungsaufwand.…

Weiterlesen: Präzise 2D-Inspektion mit nativer Edge-Intelligenz
Bild: ©Gorodenkoff/stock.adobe.com

Schwingungen sensorgestützt überwachen

Retrofit mit LoRaWAN

Früher erfassten Mitarbeitende in monatlichen Vor-Ort-Begehungen Anlagen-Schwingungen mit Handmessgeräten. Heute liefern batteriebetriebene Sensoren von Kiotera diese Daten über ein Gateway an eine Datenplattform. Der Return on Investment ist…

Weiterlesen: Retrofit mit LoRaWAN
Bild: Easyfairs GmbH

Zuwächse für die All About Automation Friedrichshafen

Persönliche Gespräche, kurze Wege, konkrete Lösungen und eine gute Messeatmosphäre prägten die All About Automation in Friedrichshafen am 10. und 11. März.

Weiterlesen: Zuwächse für die All About Automation Friedrichshafen
Bild: COSCOM Computer GmbH

Grob-Werke und Coscom mit Partnerschaft im Tool-Management

Im Institut für Produktionstechnik und CIMTT (CIM-Technologie-Transfer) in Kiel oder in Unternehmen wie der Franz Xaver Meiller Fahrzeug- und Maschinenfabrik kommen Grob-Bearbeitungszentren zum Einsatz.

Weiterlesen: Grob-Werke und Coscom mit Partnerschaft im Tool-Management
Bild: Wireless Logic mdex GmbH

Raspberry Pi IoT-Kit für den industriellen Einsatz

Astradis Elektronik kündigt das Raspberry Pi IoT-Kit an, das professionelle Entwickler dabei unterstützt, Raspberry Pi in M2M-Projekten einzusetzen.

Weiterlesen: Raspberry Pi IoT-Kit für den industriellen Einsatz

Anzeige

Präzise 2D-Inspektion mit nativer Edge-Intelligenz

In der industriellen Bildverarbeitung stellen PC-basierte Systeme oft eine technische Hürde dar. Die Trennung von…

Weiterlesen: Präzise 2D-Inspektion mit nativer Edge-Intelligenz
Digitalisierungstechnologien und ihre Bedeutung für die Wirtschaft

Laut einer repräsentativen Bitkom-Befragung von 604 Unternehmen ab 20 Beschäftigten gehen 86% davon aus, dass…

Weiterlesen: Digitalisierungstechnologien und ihre Bedeutung für die Wirtschaft

Siemens errichtet neue Produktionsstätte in Amberg

Siemens plant eine Erneuerung am Produktions- und Entwicklungsstandort Amberg.

Weiterlesen: Siemens errichtet neue Produktionsstätte in Amberg
Glasfaser-Verfügbarkeit verbessert

Die Verfügbarkeit von Glasfaser verbessert sich laut einer Untersuchung von 1&1 Versatel: Noch 25% der für eine Untersuchung befragten 533 Unternehmen bemängelt…

Weiterlesen: Glasfaser-Verfügbarkeit verbessert

Abschluss des Projekts ‚Nalyses‘

Scheinwerfer CO2-optimiert

Wie der ökologische Fußabdruck mechatronischer Produkte reduziert werden kann, haben die Beteiligten im Forschungsprojekt ‚Nalyses‘ erprobt. Dabei entstand ein neuartiger Scheinwerfer für…

Weiterlesen: Scheinwerfer CO2-optimiert
Die Nominierten für den Hermes Award stehen fest

Eine unabhängige Jury hat unter den zahlreichen Einreichungen drei Unternehmen für den Hermes Award nominiert: Festo, Schaeffler und Ziehl-Abegg.

Weiterlesen: Die Nominierten für den Hermes Award stehen fest

VDI-Studie zu Qualifizierung und Re-Skilling

Ingenieure sehen hohen Qualifizierungsbedarf wegen KI

Eine aktuelle VDI-Studie zeigt, dass Qualifizierung und Re-Skilling in technischen Berufen keine Randthemen sind, sondern ein Schlüssel, um Fachkräfte gezielt in neue…

Weiterlesen: Ingenieure sehen hohen Qualifizierungsbedarf wegen KI
Ergebnisse aus dem Industrie-4.0-Barometer von MHP und LMU

DACH-Region optimiert Kosten, China baut Fabrik der Zukunft

Das Industrie-4.0-Barometer von MHP und der LMU zeigt: Industrieunternehmen setzen international immer mehr Industrie-4.0-Technologien ein. China und die USA bauen ihren Vorsprung…

Weiterlesen: DACH-Region optimiert Kosten, China baut Fabrik der Zukunft
Projektstart auf der Light + Building

Mit CraftForward zum digitalen Produktpass für Handwerksbetriebe

Im neuen Forschungsprojekt ‚CraftForward‘ entwickelt das Fraunhofer IPK gemeinsam mit vier Partnern aus Industrie und Handwerk einen digitalen Produktpass, der zirkuläre Geschäftsmodelle…

Weiterlesen: Mit CraftForward zum digitalen Produktpass für Handwerksbetriebe
Ein Lernzentrum für Roboter entsteht

Das Munich Institute of Robotics and Machine Intelligence (Mirmi) der Technischen Universität München (TUM) und das Unternehmen Neura Robotics planen ein Forschungs-…

Weiterlesen: Ein Lernzentrum für Roboter entsteht

Anlagenbauer Martin setzt auf Stackable

Abfall wird zu Daten

Seit mehr 100 Jahren baut die Firma Martin thermische Abfallbehandlungsanlagen zur Energiegewinnung. Neuerdings setzt das Unternehmen dabei auf IoT-Datenauswertung. Um etwa den…

Weiterlesen: Abfall wird zu Daten
Praxistest von Comcast, Classiq und AMD

Netzoptimierung per Quantencomputing

In einem gemeinsamen Test von Comcast, Classiq und AMD haben die Beteiligten die Ausfallsicherheit von Internetdiensten durch die Kombination von Quantenalgorithmen und…

Weiterlesen: Netzoptimierung per Quantencomputing
Partnerschaft zwischen NTT Data und Ericsson

NTT Data und Ericsson gehen eine mehrjährige strategische Partnerschaft ein.

Weiterlesen: Partnerschaft zwischen NTT Data und Ericsson
VDMA-Fachverband erwartet Umsatzrückgang

Für 2026 erwartet der Fachverband VDMA Robotik + Automation einen Umsatzrückgang von 5% auf 14,1Mrd.€.

Weiterlesen: VDMA-Fachverband erwartet Umsatzrückgang
Wettbewerbsfähigkeit der Industrie zeigt Abwärtstrend

Knapp jedes dritte Industrieunternehmen berichtet in einer Untersuchung des Ifo Instituts von einem Rückgang seiner Wettbewerbsfähigkeit.

Weiterlesen: Wettbewerbsfähigkeit der Industrie zeigt Abwärtstrend
Hannover Messe: Neue Aussteller und viel KI

Die Hannover Messe 2026 (20. bis 24. April) stellt künstliche Intelligenz in der Industrie in den Mittelpunkt und zeigt den praxisnahen und…

Weiterlesen: Hannover Messe: Neue Aussteller und viel KI
Von AI und Data Science bis Robotik

Wie werden aus Innovationen insbesondere in der KI konkrete Anwendungen mit Mehrwert?

Weiterlesen: Von AI und Data Science bis Robotik
AAS-Anwendertreffen in Kaiserslautern

Die Asset Administration Shell (AAS) ist bereit für den industriellen Einsatz.

Weiterlesen: AAS-Anwendertreffen in Kaiserslautern