Neue Open-Source-KI-Sprachmodelle: Werden sie die Zukunft revolutionieren?

Am 14. Januar 2025 gab die Ruhr-Universität Bochum (RUB) bedeutende Neuigkeiten im Bereich der künstlichen Intelligenz (KI) bekannt. Ab sofort haben Nutzer von GPT@RUB die Möglichkeit, nicht nur auf die verschiedenen Versionen von OpenAI-Modellen zuzugreifen, sondern auch mehrere neue Open-Source-Sprachmodelle auszuwählen. Diese Entscheidung zur Einführung von Open-Source-Technologien zielt darauf ab, die digitale Souveränität der Universität zu fördern und die Abhängigkeit von kommerziellen Anbietern zu reduzieren. Martin Bovermann von IT.SERVICES unterstreicht die Bedeutung dieses Schrittes.

Die neuen Open-Source-Modelle stehen vorerst kostenlos zur Verfügung und belasten das persönliche Token-Konto der Nutzer nicht. Die Modelle sind nützlich für Programmieraufgaben und Übersetzungen. Ein weiterer Vorteil besteht darin, dass sie lokal betrieben werden können, was bedeutet, dass sensible Daten nicht an externe Anbieter weitergegeben werden. Die Basis-Funktionalität wird über die Gemeinsame Wissenschafts- und Datenverarbeitungsgesellschaft (GWDG) und deren KI-Servicezentrum KISSKI bereitgestellt, welches vom Bundesministerium für Bildung und Forschung unterstützt wird.

Vielfältige Sprachmodelle im Angebot

Die RUB bietet eine Auswahl an experimentellen Open-Source-Sprachmodellen, die besonderen Anforderungen gerecht werden sollen. Diese Modelle umfassen unter anderem:

LLaMA 3.1 70B Instruct: für komplexe Aufgaben wie Berichte und Code Snippets.
NVIDIA LLaMA 3.1 Nemotron 70B Instruct: spezialisiert auf Reward-Modelling Fine-Tuning.
Teuken 7B Instruct Research: ein mehrsprachiges Modell, das auf die 24 Amtssprachen der EU trainiert wurde.
Mistral Large: fokussiert auf die Sprachen Französisch, Italienisch und Spanisch.
Codestral 22B: für Programmierung in über 80 Programmiersprachen.

Diese Auswahl von Modellen ist nicht nur eine Erweiterung des bestehenden Angebots, sondern auch ein Schritt in Richtung einer nachhaltigeren und zukunftsorientierten Nutzung von KI-Technologien

Teuken-7B und das OpenGPT-X-Projekt

Ein besonders hervorzuhebendes Modell ist Teuken-7B, das im Rahmen des OpenGPT-X-Projekts entwickelt wurde. Dieses Projekt, das mit rund 14 Millionen Euro vom Bundesministerium für Wirtschaft und Klimaschutz gefördert wird, beschäftigt sich mit der Entwicklung eines großen KI-Sprachmodells, das den multilingualen Anforderungen Europas gerecht wird. Die TU Dresden spielt dabei eine maßgebliche Rolle, indem sie die Infrastruktur bereitstellt und bei der Modellentwicklung unterstützt.

Teuken-7B zeichnet sich durch seine anpassbare Generative Künstliche Intelligenz aus, die vielfältige Anwendungen ermöglicht. Es wird unter der Lizenz „Apache 2.0“ für Forschungs- und kommerzielle Zwecke zum kostenlosen Download angeboten, unter anderem auf der Plattform Hugging Face. Die mehrsprachige Vorverarbeitung und Integration in das Gaia-X-Ökosystem tragen zur sicheren Anwendung in Unternehmen bei, was den Umgang mit sensiblen Daten betrifft.

Obwohl Open-Source-Modelle viele Vorteile bieten, wie Kosteneffizienz und Transparenz, müssen Nutzer sich auch der Herausforderungen bewusst sein, darunter technische Komplexität und Sicherheitsrisiken. Daher ist eine fundierte Recherche über die Modelle unerlässlich, bevor man diese in der Praxis einsetzt. Diese neuen Ressourcen unterstreichen das Potenzial von Open-Source-KI, die Nutzung von künstlicher Intelligenz für akademische und industrielle Anwendungen grundlegend zu verändern und zugänglicher zu machen.

Die Entwicklung und Bereitstellung solcher Modelle stehen in einer langen Tradition von Innovationsbestrebungen in der KI-Forschung, die darauf abzielen, Barrieren abzubauen und neue Möglichkeiten für eine effektive Datenverarbeitung zu schaffen. So wissen wir, dass Open-Source-KI-Modelle ständig wachsen und sich weiterentwickeln, um den Anforderungen moderner Nutzer gerecht zu werden.