DeepSeek: Wendepunkt für die KI-Branche?
Was ist passiert?
Am 20. Januar wurde DeepSeek R1 veröffentlicht. Das chinesische KI-Modell ist ähnlich leistungsfähig wie die führenden KI-Modelle von OpenAI, Anthropic AI oder Alphabet. Der entscheidende Unterschied liegt in der Effizienz. DeepSeek benötigt eigenen Angaben zufolge deutlich weniger Rechenleistung und hat angeblich nur 5,6 Millionen US-Dollar für den finalen Trainingsvorgang gekostet – ein Bruchteil der Kosten, die westliche Modelle verursachen. Bereits im Dezember hatte das veröffentlichte Modell DeepSeek V3 in Fachkreisen für Aufmerksamkeit gesorgt. Da nun immer mehr darüber berichtet wurde und die Leistungsfähigkeit des neuesten Modells auch von westlichen KI-Unternehmen gelobt wurde, erhielt das Thema über das Wochenende auch in der Breite große Aufmerksamkeit.
DeepSeek, das einem KI-Hedgefonds aus Hongkong gehört, hat technische Abhandlungen veröffentlicht, die detailliert erklären, wie sie diese Effizienzsteigerung erreicht haben. Die Angaben erscheinen damit glaubhaft. Zwar dürfte weiterhin darüber debattiert werden, wie groß der Ressourcen-Aufwand tatsächlich war. Allerdings ist davon auszugehen, dass DeepSeek aufgrund der US-Exportrestriktionen mit deutlich weniger Rechenleistung zurechtkommen musste als die westlichen KI-Entwickler. Das Unternehmen sah sich also quasi gezwungen, mit den zur Verfügung stehenden Chips kreative Lösungen zur Effizienzsteigerung zu entwickeln. Der Trainingsprozess war somit Schätzungen zu Folge um 20-50x effizienter als bisherige Ansätze, da verschiedene Techniken genutzt wurden, um den Speicher- und Rechenbedarf zu optimieren. Darüber hinaus ist das Modell auch in der Interferenz, also Bearbeitung von Anfragen, deutlich effizienter.
Kostenfrei von jederman zu nutzen
Die größte Version von DeepSeek-R1 umfasst 671 Milliarden Parameter. Sie kann von jedermann kostenfrei genutzt werden – entweder via Internet oder über die DeepSeek-App, die in den Appstores von Apple und Google zum Download bereitsteht. Dies ist eine direkte Kampfansage an OpenAI. Für dessen ChatGPT-Version o1 müssen Nutzer 20 USD im Monat bezahlen. Daneben bietet das Unternehmen mehrere verkleinerte Varianten mit 1,5 bis 70 Milliarden Parametern an. DeepSeek-R1 unterliegt allerdings in der Grundkonfiguration China-spezifischen Einschränkungen, da KI-Systeme in der Volksrepublik gemäß den Vorschriften für Internetdienste "sozialistische Kernwerte" implementieren müssen. Wie das Portal ArsTechnica berichtet, verweigert das System beispielsweise Antworten zu politisch sensiblen Themen wie dem Tian'anmen-Platz oder dem Status Taiwans.
Warum ist das so ein großes Thema für die Märkte?
Die Bedeutung von DeepSeek lässt sich aus zwei Perspektiven betrachten: der geopolitischen und der wirtschaftlichen. Die geopolitische Betrachtung lautet: China holt auf und hat im KI-Rennen plötzlich mit den USA gleichgezogen, die bislang als führend galten. Die Veröffentlichung von DeepSeek als Open-Source-Modell, kombiniert mit detaillierten technischen Dokumentationen ohne Geheimhaltung, zeigt, dass der chinesische Staat hier strategisch involviert ist. Und es zeigt, dass China trotz westlicher Exportkontrollen für Hochleistungs-KI-Chips in der Lage ist, vergleichbare oder bessere Ergebnisse zu erzielen – möglicherweise sogar dank dieser Beschränkungen, da die Forscher dadurch zu innovativen Lösungen gezwungen wurden. China übt damit Zugzwang auf westliche Unternehmen aus. Durch das kostenlose Angebot von DeepSeek geraten Unternehmen wie OpenAI und Google unter Druck, die für ihre KI-Modelle hohe Gebühren verlangen. Indem China die Technologie offenlegt, wird der Wettbewerb im Bereich der großen Sprachmodelle (LLMs) weiter angeheizt. Es ist wahrscheinlich, dass viele Nachahmer versuchen werden, den chinesischen Ansatz zu kopieren.
Ein wirtschaftlicher Schock
Wirtschaftlich betrachtet ist DeepSeek ein Schock für die erfolgsverwöhnte US-Tech-Branche und der Hauptgrund für die heftigen Marktreaktionen. Die Märkte befürchten, dass westliche Tech-Unternehmen, welchen bislang ein Quasi-Monopol bei der Entwicklung Künstlicher Intelligenz zugesprochen wurde, viel zu viel Geld für KI-Chips, Serverfarmen und andere KI-Investitionen ausgegeben haben könnten, während China offenbar mit einem Bruchteil der Kosten ähnliche Ergebnisse liefern kann. Investoren stellen sich daher die Frage: Werden künftig Unternehmen wie ChatGPT-Entwickler OpenAI, Microsoft oder Meta weniger KI-Chips benötigen, um ihre Modelle weiterzuentwickeln? Werden Halbleiterunternehmen daher mit massiven Auftragseinbrüchen rechnen müssen? Und werden die Hersteller von Gaskraftwerken reihenweise Stornierungen erleben, da die neuen KI-Modelle künftig viel weniger Strom benötigen? Denn eines ist klar: Wenn weniger Rechenleistung benötigt wird, sinkt bei gleichbleibender Nachfrage nach KI-Modellen, auch die Nachfrage nach (Nvidia-)Chips (die sogenannten GPUs), Rechenzentren und Strom. Dies erklärt, warum Aktien entlang der gesamten Wertschöpfungskette unter Druck stehen. Hinzu kommt: Führende KI-Modelle scheinen nun endgültig zu einer Massenware zu werden. Die Konkurrenz unter den Entwicklern von leistungsfähigen Sprachmodellen nimmt zu.
Hoffen auf das Jevons-Paradoxon
Allerdings gibt es auch eine andere Sichtweise. Diese liegt im sogenannten „Jevons-Paradoxon“ begründet. Das Paradoxon besagt, dass technischer Fortschritt, der die Effizienz steigert, oft zu einer erhöhten Nutzung der Ressource führt, anstatt sie zu senken. Wenn KI-Modelle günstiger werden, könnten sie noch häufiger eingesetzt werden, wodurch die Nachfrage nach KI sogar steigen würde. Zudem optimieren Tech-Konzerne ihre KI-Modelle bislang nicht für minimalen Ressourceneinsatz, sondern für maximale Leistung. Wenn DeepSeek zeigt, dass KI effizienter entwickelt werden kann, könnten westliche Unternehmen noch schneller Fortschritte machen und neue Anwendungsbereiche erschließen. So könnte DeepSeek bei OpenAI, Meta und Co. die Dringlichkeit erhöhen, ihren Hauptvorteil (Zugriff auf GPUs) zu nutzen, um sich von billigeren Alternativen abzuheben. Die Stargate-Ankündigung von Donald Trump sowie Kommentare von Meta bezüglich der Höhe seiner geplanten KI-Investitionen unterstützen diese These.
Und schließlich ist bei Nachrichten aus China oft Vorsicht geboten. Es gibt Stimmen, die behaupten, dass der tatsächliche Aufwand deutlich größer war als offiziell berichtet. Möglicherweise hatte DeepSeek Zugang zu mehr Chips, als die Exportkontrollen erlauben. Der Effizienzvorteil könnte also geringer sein, als aktuell angenommen wird.
Die Veröffentlichung von DeepSeek hat vorerst zu erheblichen Kursverlusten bei Technologiewerten geführt. So büßte Nvidia an der Börse an einem Tag fast 600 Milliarden US-Dollar an Wert ein, nachdem die Aktie fast 17 Prozent tiefer aus dem Handel ging. Auch am deutschen Markt ging das Thema nicht spurlos vorbei. Siemens Energy verlor zwischenzeitlich 20 Prozent, nachdem die Aktie zuvor stark gestiegen war. Experten betonen jedoch, dass diese Aufregung übertrieben sein könnte. Zwar sei DeepSeek effizienter, aber die Technologie nicht revolutionär.
Fazit
Die Veröffentlichung von DeepSeek hat die Tech-Branche und die Finanzmärkte aufgerüttelt. Es ist noch zu früh, um abzusehen, ob dies eine Nachkaufchance oder der Beginn eines größeren Rücksetzers ist.