DeepSeek: “Keine Supernova, aber ein Achtungserfolg” – Interview mit Aljoscha Burchardt

DeepSeek: “Keine Supernova, aber ein Achtungserfolg” – Interview mit Aljoscha Burchardt

30.01.25

Ein neues Sprachmodell sorgt für Aufmerksamkeit: DeepSeek. Doch was bedeutet das für den Einsatz von KI in Hochschulen? Aljoscha Burchardt spricht im Interview über Effizienzgewinne, Werte und die Rolle Europas in der KI-Entwicklung. Zudem geht es um die Frage, wie Hochschulen souveräne KI-Infrastrukturen gestalten können – und ob große Sprachmodelle wirklich immer besser sind.

Alle reden über ein neues LLM DeepSeek. Die Performance scheint gängigen Modellen zu entsprechen. Warum also die Aufregung? Was hat sich über Nacht geändert, sodass manche von einem neuen „Supernova-Moment“ in der KI-Entwicklung sprechen? Kannst du das einordnen?

Der Clou ist, dass das Modell deutlich weniger Ressourcen benötigt als bisherige Modelle, insbesondere in Bezug auf Rechenleistung. Es läuft in verschiedenen Versionen sogar auf kleiner Hardware. Das hat mich allerdings nicht überrascht. Vielmehr hat mich erstaunt, dass Hyperscaler weiterhin nach dem Motto „Viel hilft viel“ immer mehr Ressourcen in Modelle investieren. Man munkelt bereits, dass selbst das gesamte Internet nicht mehr als Trainingsdaten ausreicht.

In der Wissenschaft arbeiten wir zwangsweise mit kleineren Modellen und untersuchen, wie Effizienzgewinne erzielt und Ressourcen eingespart werden können. Auch DeepSeek hat Millionen Dollar für das Training investiert, aber eben nicht mehr als nötig. Die Entwickler sind wissenschaftlich vorgegangen und haben viele Komponenten der Trainingsarchitektur hinterfragt und optimiert. Eine Supernova sehe ich nicht, aber einen beachtlichen Erfolg allemal.

Erste Reaktionen drehen sich vor allem um einen Aspekt: Welche Rolle spielt es, dass DeepSeek aus China kommt? Was unterscheidet es von gängigen Sprachmodellen?

Verschiedene Analysen zeigen, dass das Modell bei bestimmten politisch sensiblen Themen ausweichend reagiert, die in China als Tabu gelten. Dieses „Harmless Training“ kennen wir auch von westlichen Modellen – nur sind dort die Themen andere.

Die Entwickler berichten über die Leistung in gängigen Benchmarks, was darauf hindeutet, dass sich DeepSeek in vielen Aspekten ähnlich verhält wie bisherige Modelle. Allerdings lässt sich nie abschließend bewerten, welche Fähigkeiten das Modell tatsächlich besitzt, da unklar bleibt, welche Benchmarks oder vergleichbaren Aufgaben bereits in den Trainingsdaten enthalten waren. Das sind meines Erachtens nur Momentaufnahmen. Vergleichbar wäre es, wenn zwei potentielle Praktikanten zur Auswahl stünden und ich ohne Bezug zu einem geplanten Einsatz fragen würde: Was können die denn jeweils? Oder noch globaler: Wer von beiden ist besser?

Zum Training des Modells sollen auch Daten etablierter Anbieter von LLMs genutzt worden sein. Sind eigene, „souveräne“ LLMs wirklich unabhängig, oder sind sie immer „Zwerge auf den Schultern von Riesen“? Und brauchen wir überhaupt immer so große Sprachmodelle?

KI-Modelle basieren immer auf unserem Wissen. Ob sie auf unstrukturierte Rohdaten aus dem Web, auf speziell kuratierte Datensätze oder auf menschliche Interaktionen trainiert werden, variiert je nach Architektur. Zudem können KI-Modelle auch selbst neue Trainingsdaten generieren.

Große Sprachmodelle sind nicht immer notwendig. In der Forschung arbeiten wir bereits seit Langem mit kleineren Modellen, die sich auf Sprachverarbeitung konzentrieren, anstatt universelle Problemlöser – vom Sudoku bis zum Jura-Examen – zu sein. Diese Modelle lassen sich mit Datenbanken kombinieren und für spezifische Aufgaben trainieren. Sie benötigen weniger Daten und Energie und bieten oft eine bessere Kontrolle über ihre Funktionsweise.

``Unser Ziel sollte sein, in Europa Souveränität zu erlangen. Es ist erstaunlich, dass dies noch nicht ganz oben auf der politischen Agenda steht.``

Die Stargate-Ankündigung und nun DeepSeek führen zu einem zunehmend geopolitisch geprägten KI-Diskurs. Welche Möglichkeiten siehst du für gemeinsame europäische KI-Ansätze?

Forschung hat noch nie an Landesgrenzen haltgemacht. Wir am DFKI arbeiten beispielsweise seit Langem eng mit INRIA in Frankreich zusammen und sind in diversen europäischen Netzwerken aktiv, die wir teilweise koordinieren. In einem dieser Netzwerke haben wir Sprachdaten für alle europäischen Sprachen gesammelt. Zudem setzen wir uns für ein CERN für KI ein – eine Idee, die auch auf EU-Ebene diskutiert wird.

Meiner Meinung nach haben wir bereits genug Herausforderungen mit der breiten Einführung von Digitalisierung und KI. Daher würde ich persönlich versuchen, meine Energie nicht zu stark in geopolitische Debatten zu stecken. Dennoch sollte unser Ziel sein, in Europa Souveränität zu erlangen – von der Chip-Produktion bis hin zu einem Pluralismus von LLMs, die unsere Werte und unser Know-how widerspiegeln. Es ist erstaunlich, dass dies noch nicht ganz oben auf der politischen Agenda steht.

Hochschulen als Motor für KI-Entwicklung

Welche Rolle können Hochschulen und öffentlich finanzierte KI-Infrastrukturen spielen?

Hochschulen könnten eine zentrale Rolle in der Entwicklung spielen, indem sie Menschen ausbilden, die den Wandel der technologiegestützten Kommunikation und Wissensverarbeitung aktiv mitgestalten und somit zur Gestaltung einer neuen Gesellschaft beitragen. Dafür braucht es neben technischer Expertise vor allem eine Haltung, die von Neugier, Gestaltungsfreude und Veränderungsbereitschaft geprägt ist, aber auch von Urteilsfähigkeit, gesundem Menschenverstand und der Fähigkeit, Kritik zu üben und zu vertreten – also eigentlich ein Set aus zutiefst menschlichen Eigenschaften.

Ein essenzieller Faktor ist die gelebte Interdisziplinarität – beginnend bei der zwischenmenschlichen Kommunikation bis hin zu Publikationswegen und Projektförderungen, die heute häufig noch zu stark in Silos organisiert sind. Es braucht mehr Mut, diese Strukturen aufzubrechen und innovative Ansätze zu fördern.

Was müsste aus deiner Sicht passieren, damit ein erfolgreiches europäisches KI-Innovations-Ökosystem entsteht? Und wie können neue Lösungen entwickelt und skaliert werden?

Bei solch tiefgreifenden technologischen Umbrüchen stellt sich immer die Frage, ob der Wandel durch „Push“ oder „Pull“-Mechanismen vorangetrieben wird. In den meisten Fällen ist die Antwort: Es braucht beides. Eine starke Nachfrage aus Industrie, Forschung, Politik und Verwaltung ist ebenso essenziell wie gezielte Angebote, um den Wandel aktiv zu gestalten. Diese Wechselwirkung zwischen Anwendungsbedarf und technologischen Lösungen ist entscheidend für eine nachhaltige Entwicklung eines europäischen KI-Ökosystems.

DeepSeek in der (Bildungs-)Praxis

Hat DeepSeek besondere Eigenschaften, die es im Vergleich zu anderen LLMs für Bildungseinrichtungen besonders interessant machen?

Besonders attraktiv erscheint die Möglichkeit, das Modell als Offline-Version auf dem eigenen Laptop zu installieren. So können Datenschutzbedenken reduziert werden, da Anfragen nicht über externe Server laufen.

``Ein überstürztes Handeln ist nicht notwendig.``

Viele Bildungseinrichtungen haben gerade erst begonnen, LLMs bereitzustellen. Stehen sie nun vor der Herausforderung, kontinuierlich auf neue Entwicklungen reagieren zu müssen?

Nicht unbedingt. Ein Wechsel wäre vor allem dann sinnvoll, wenn Lizenzkosten zu hoch sind oder leistungsfähigere Modelle zur Verfügung stehen. Ein überstürztes Handeln ist daher nicht notwendig.

Würdest du Studierenden und Lehrenden empfehlen, DeepSeek auszuprobieren?

Ich nähere mich solchen Fragen immer von der Anwendungsperspektive: Wofür soll das Tool genutzt werden? Benötige ich spezifische Funktionen wie Internetanbindung oder die Verarbeitung längerer Dokumente? Dürfte es etwas kosten? Möchte ich verschiedene Modelle vergleichen? Die Antworten auf diese Fragen sollten die Wahl des passenden Modells bestimmen.

Bald beginnt die Prüfungsphase an vielen Hochschulen. Welche Daten geben Studierende preis, wenn sie sich mit DeepSeek vorbereiten?

Ob Mathematik oder Germanistik – das ist eine sehr allgemeine Frage. Oft verhalten wir uns in solchen Fällen widersprüchlich: Viele teilen ihre Gesundheitsdaten, Ernährungsgewohnheiten oder persönliche Vorlieben bedenkenlos mit Suchmaschinen oder anderen Online-Diensten.

Welche ungelösten Herausforderungen in Bezug auf LLMs und ihren Einsatz – insbesondere in öffentlichen Einrichtungen wie Universitäten – kommen in der aktuellen Debatte zu kurz?

Für mich ist die zentrale Frage, wie wir aus den zahlreichen individuellen Einsatzgebieten, Veränderungsprozessen und Erfahrungen als Institution – und letztlich auch als Gesellschaft – lernen können. Es geht darum, einen fundierten Wissensstand und letztlich einen Standpunkt zu entwickeln. Dies ist nicht zwingend erforderlich, wäre jedoch ein entscheidender Schritt, um darauf aufbauend neue Bildungsideale und Ausbildungsziele für die Zukunft zu formulieren, die wir in einer zunehmend KI-geprägten Welt definitiv benötigen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert