Neue Open-SourceSprachmodelle für Europa veröffentlicht

Am Deutschen Forschungszentrum Künstliche Intelligenz (DFKI) sowie im Hessischen Zentrum für Künstliche Intelligenz (hessian.AI) wurde von Wissenschaftlerinnen und Wissenschaftlern die Initiative Occiglot gegründet, die generative Open-Source-Sprachmodelle für die europäischen Sprachen entwickelt. Aufgrund der Dominanz der englischen Sprache im Internet funktionieren Sprachmodelle besser für Anfragen auf Englisch. Kapitalstarke Unternehmen sind zudem eher in der Lage, die notwendige Rechenleistung bereitzustellen. Weniger verbreitete Sprachen und nichtkommerzielle Projekte benötigen stattdessen Ansätze, um Nachteile auszugleichen und nicht profitabel erscheinende Gebiete zu erschließen. Hier setzt das Projekt Occiglot an, indem es eine Interessengemeinschaft von Forschenden, Sprachexperten, Software-Entwickelnden und Nutzenden bildet. Alle 24 Amtssprachen der Europäischen Union sowie weitere inoffizielle und regionale Sprachen sollen im Sprachmodell berücksichtigt werden. Die erste Version mit zehn Sprachmodellen wurde nun veröffentlicht und konzentriert sich auf Englisch, Deutsch, Französisch, Spanisch und Italienisch. www.dfki.de