wal springt aus dem wasser

DeepSeek R1: Chancen und Risiken der chinesischen Open-Source-KI

DeepSeek R1: Chancen und Risiken der chinesischen Open-Source-KI

DeepSeek R1 beeindruckt als Open-Source-LLM, birgt jedoch Zensur- und Datenschutzrisiken in der Webversion.

Die Künstliche Intelligenz und Technologie um LLMs (Large Language Models) entwickelt sich rasant, und der Wettkampf zwischen Unternehmen aus den USA, Europa und China erreicht eine neue Stufe. Während OpenAI, Google DeepMind und Meta den Markt mit ihren hochentwickelten Modellen dominieren, tritt mit DeepSeek ein ernstzunehmender Herausforderer auf die globale Bühne. Das Unternehmen aus China hat mit seinem Modell DeepSeek R1 eine bemerkenswerte Open-Source-KI veröffentlicht, die technisch mit den besten Sprachmodellen der westlichen Welt mithalten kann.

Allerdings gibt es erhebliche Bedenken hinsichtlich der Webversion von DeepSeek R1, die durch ihre systematische Zensur und chinesische Propaganda negativ auffällt. Auch die Art und Weise, wie Nutzerdaten verarbeitet werden, sorgt für Besorgnis. Gleichzeitig bietet die Open-Source-Variante von R1 eine völlig andere Perspektive: Sie ist frei von Zensur, lokal ausführbar und könnte den Open-Source-Wettbewerb im Bereich großer Sprachmodelle revolutionieren.

Dieser Artikel beleuchtet die Entstehungsgeschichte von DeepSeek, die technischen Stärken des Modells R1 und die problematischen Aspekte der Webversion. Zudem wird erläutert, warum die Open-Source-Version von R1 den KI-Markt nachhaltig verändern könnte, während die Webversion gleichzeitig erhebliche Risiken birgt.

Die Entstehung von DeepSeek

DeepSeek wurde 2023 von Liang Wenfeng in Hangzhou, China, gegründet. Das Unternehmen entstand unter der Schirmherrschaft von High-Flyer Capital, einem von Wenfeng geleiteten Hedgefonds, der stark in die Entwicklung von Künstlicher Intelligenz investiert. Schon früh machte sich DeepSeek einen Namen in der chinesischen KI-Szene, indem es fortschrittliche Sprachmodelle entwickelte, die mit westlichen Modellen konkurrieren konnten.

Der entscheidende Durchbruch kam im Dezember 2024 mit der Veröffentlichung von DeepSeek V3. Dieses Open-Source-Sprachmodell wurde unter der MIT-Lizenz veröffentlicht und erlangte schnell weltweite Aufmerksamkeit, weil es sich durch hohe Effizienz und beeindruckende Leistungswerte auszeichnete. Während viele Open-Source-Modelle von westlichen Unternehmen eher konservativ freigegeben werden, war DeepSeek V3 in seiner Nutzung nahezu uneingeschränkt.

Mit der Veröffentlichung von DeepSeek R1 im Januar 2025 wurde dieser Trend fortgesetzt. R1 wurde speziell auf logische Schlussfolgerungen und Vergleichstests optimiert, sodass es sich insbesondere für analytische und wissenschaftliche Anwendungen eignet. Erstaunlich ist, dass das Modell mit einem Budget von nur 5,6 Millionen US-Dollar entwickelt wurde – ein Bruchteil der Summen, die OpenAI, Google oder Meta für ihre neuesten Modelle ausgeben. Trotz dieser geringen Investitionen kann DeepSeek R1 mit führenden KI-Modellen konkurrieren und stellt damit eine ernsthafte Alternative für viele Unternehmen und Entwickler dar. Beobachter und Konkurrenten vermuten daher auch, dass es sich hierbei um eine KI handelt, die auf Basis der Konkurrenz trainiert wurde statt auf einem eigenen Datensatz.

Technische Merkmale von DeepSeek R1

DeepSeek R1 basiert auf einer effizienten Architektur, die es dem Modell ermöglicht, mit deutlich geringerem Rechenaufwand hohe Leistungen zu erzielen. Während viele westliche Modelle auf umfangreiche Rechenzentren angewiesen sind, nutzt R1 optimierte Algorithmen und Speichertechniken, um eine ähnliche Qualität mit weniger Ressourcen zu erreichen.

Besonders auffällig ist die Fähigkeit des Modells, logische Zusammenhänge zu analysieren und in komplexen Tests präzise Schlussfolgerungen zu ziehen. Während viele Sprachmodelle bei Aufgaben scheitern, die fortgeschrittenes logisches Denken erfordern, wurde DeepSeek R1 gezielt darauf trainiert, in diesem Bereich besser abzuschneiden. Dementsprechend performt es sehr weit oben in etwaigen LLM-Vergleichen.

Die Open-Source-Natur des Modells bietet einen weiteren entscheidenden Vorteil: Entwickler haben die Möglichkeit, das Modell auf eigene Bedürfnisse anzupassen, ohne von proprietären Plattformen abhängig zu sein. Dies eröffnet völlig neue Möglichkeiten für Unternehmen und Wissenschaftler, die bisher auf kostenpflichtige Dienste von OpenAI oder Google angewiesen waren.

Zensur und Propaganda in der Webversion

Trotz der beeindruckenden technischen Eigenschaften von DeepSeek R1 gibt es erhebliche Probleme mit der Webversion des Modells. Mehrere unabhängige Tests haben gezeigt, dass die Online-Variante systematische Zensur betreibt und in vielen Fällen offizielle chinesische Regierungspositionen widerspiegelt.

Ein besonders besorgniserregender Aspekt ist, dass bestimmte Fragen entweder gar nicht beantwortet oder durch vorgeschaltete Filter blockiert werden. Themen wie das Tiananmen-Massaker, die Unabhängigkeit Taiwans oder die Lage der Uiguren in Xinjiang werden entweder umgangen oder beschönigt.

Untersuchungen von Technologiejournalisten haben gezeigt, dass die Webversion von R1 bestimmte Begriffe in Echtzeit analysiert und bei Bedarf Antworten modifiziert. In einigen Fällen wurden Antworten sogar direkt verändert, während der Nutzer noch tippte – ein Hinweis darauf, dass eine aktive Überwachung und Manipulation der generierten Inhalte stattfindet.

Die Tatsache, dass DeepSeek R1 in der Webversion solche Filter implementiert, hat weitreichende Implikationen für die globale Verbreitung von Informationen. Während OpenAI oder Google ebenfalls Moderationsmechanismen in ihre KI-Modelle einbauen, ist die chinesische Variante deutlich restriktiver und verfolgt klar erkennbare politische Ziele.

Datenschutzrisiken in der Webversion

Neben der inhaltlichen Zensur gibt es erhebliche Datenschutzbedenken hinsichtlich der Webversion von DeepSeek R1. Berichten zufolge speichert das System Nutzereingaben und sendet sie an Server in China, wo sie nach den dortigen Gesetzen gespeichert und analysiert werden können.

China verfügt über eine der strengsten Überwachungsgesetzgebungen weltweit. Unternehmen sind verpflichtet, auf Anfrage der Regierung Nutzerdaten bereitzustellen. Dies bedeutet, dass alle Interaktionen mit der Webversion potenziell überwacht und ausgewertet werden können.

Für Nutzer außerhalb Chinas stellt dies ein erhebliches Risiko dar. Besonders problematisch ist dies für Journalisten, Aktivisten oder Unternehmen, die sensible Daten eingeben. Es gibt keine Garantie, dass diese Daten nicht für staatliche Zwecke genutzt oder mit anderen Behörden geteilt werden. Wir raten daher sehr stark davon ab, die Webversion von DeepSeek in Unternehmen zu nutzen.

Die Open-Source-Variante als Alternative

Ein entscheidender Vorteil von DeepSeek R1 ist, dass es als Open-Source-Modell verfügbar ist. Während die Webversion stark zensiert und datenhungrig ist, gibt es in der lokal ausführbaren Version keinerlei Einschränkungen dieser Art.

Die Open-Source-Variante von R1 kann vollständig auf lokalen Rechnern oder privaten Servern betrieben werden, ohne dass Daten nach außen übertragen werden. Dies stellt einen großen Vorteil gegenüber kommerziellen Anbietern dar, die ihre Modelle nur über Online-Dienste verfügbar machen.

Viele Entwickler begrüßen die Veröffentlichung als eine der wichtigsten Entwicklungen im Open-Source-KI-Sektor, da sie es ermöglicht, ein leistungsstarkes Modell ohne Abhängigkeit von großen Konzernen oder staatlich kontrollierten Plattformen zu nutzen.

Microsoft ermöglicht es bereits, die KI über ihre eigenen Cloud-Server zu nutzen, was die Risiken um DeepSeek enorm reduziert. Zukünftig will Microsoft es auch möglich machen, die KI lokal auf Copilot+-PCs zu betreiben. Im Bereich Open-Source-LLM ist DeepSeek also ein enormer Schritt nach vorne.

Auswirkungen auf den globalen KI-Wettbewerb

Mit der Veröffentlichung von DeepSeek R1 hat sich der Wettbewerb im KI-Sektor grundlegend verändert. Bisher wurde der Markt von westlichen Unternehmen dominiert, doch nun gibt es eine ernsthafte Alternative, die sowohl technisch beeindruckt als auch durch ihre Open-Source-Strategie viele neue Nutzer anzieht.

Besonders interessant ist, dass DeepSeek R1 trotz der geringen Entwicklungskosten mit Milliardenprojekten wie GPT-4o oder Gemini 1.5 konkurrieren kann. Dies könnte langfristig zu einem Wandel im Markt führen, da Open-Source-Modelle zunehmend an Bedeutung gewinnen und kommerzielle Anbieter gezwungen sind, ihre Strategien anzupassen.

Gleichzeitig könnte damit auch das Zeitalter beginnen, in dem sich KI sozusagen „selbst frisst“. Sollte es stimmen, dass sich DeepSeek für das Datentraining an Prompts von OpenAI und Google bedient hat, dann besteht das Risiko von sogenannter Model Dementia. Mehr dazu auch in den beiden Studien dazu auf huggingface (2023) und in Nature (2024).

Fazit

DeepSeek R1 ist ein bemerkenswertes Beispiel dafür, wie leistungsfähig Open-Source-KI-Modelle sein können. Während die Webversion erhebliche Risiken hinsichtlich Zensur und Datenschutz birgt, stellt die lokale Open-Source-Variante eine echte Alternative zu proprietären Modellen dar.

Nutzer sollten sich bewusst sein, dass die Webversion politisch beeinflusst und höchstwahrscheinlich nicht sicher ist. Wer jedoch die Open-Source-Variante nutzt, kann von einem leistungsfähigen KI-Modell profitieren, das ohne Zensur oder Überwachung arbeitet. Damit stellt DeepSeek R1 sowohl eine Herausforderung als auch eine Chance für die globale KI-Entwicklung dar.

Nach oben scrollen