Anfang 2025 erregte DeepSeek-V3 mit seiner beispiellosen Trainingseffizienz weltweite Aufmerksamkeit in der KI-Gemeinschaft. Als Tochtergesellschaft von HuanFang Technology hat sich DeepSeek in nur achtzehn Monaten von einem unbekannten Start-up zu einem globalen Technologieführer entwickelt.
HuanFang Technology: Der Weg von Quantitativem Trading zur KI-Innovation
Im Huijin International Building in Hangzhou, mit Blick auf den historischen Großen Kanal, leitet ein Team unter der Führung des in den 80er Jahren geborenen Gründers Liang Wenfeng eine technologische Revolution. Hier entstand DeepSeek aus dem quantitativen Handelsriesen HuanFang Technology.
HuanFang Technology wurde 2016 gegründet und etablierte sich als Chinas führender quantitativer Hedgefonds. Das Unternehmen nutzte seine umfangreiche Expertise in KI und quantitativem Handel und begann bereits 2022 mit der Positionierung im Bereich der großen Sprachmodelle. Während der schweren Chip-Knappheit sicherte sich HuanFang vorausschauend 10.000 A100-GPUs und legte damit den Grundstein für die Entstehung von DeepSeek.
Ein einzigartiger technischer Ansatz
Anders als andere chinesische KI-Unternehmen wählte DeepSeek einen eigenen Entwicklungsweg. Gründer Liang Wenfeng ist fest davon überzeugt, dass chinesische KI-Unternehmen nicht ewige Nachahmer bleiben, sondern zur globalen technologischen Innovation beitragen sollten.
Diese Überzeugung spiegelt sich in jeder wichtigen Unternehmensentscheidung wider. Unter Chinas sieben führenden KI-Modell-Startups ist DeepSeek das einzige, das sich ausschließlich auf Forschung und Technologie konzentriert, ohne Verbraucheranwendungen zu verfolgen. Es ist auch das einzige Unternehmen, das die Kommerzialisierung nicht priorisiert und stattdessen konsequent auf Open Source setzt, ohne externe Finanzierung anzustreben.
Bahnbrechende technische Innovationen
DeepSeeks technische Innovationen zeigen sich hauptsächlich in zwei Bereichen: Architekturinnovation und Durchbrüche in der Trainingsmethodik.
Die bahnbrechende MLA-Architektur (Multi-head Latent Attention) reduziert den Speicherverbrauch auf 5-13% der traditionellen MHA-Architektur. Diese Innovation entstand aus der Einsicht eines jungen Forschers und wurde durch monatelange Teamarbeit realisiert. Zusätzlich reduziert die DeepSeekMoE-Architektur den Rechenaufwand drastisch.
In der Trainingsmethodik führte DeepSeek das FP8-Mixed-Precision-Training mit optimierten Datenverarbeitungsstrategien ein. Diese Innovationen ermöglichten es DeepSeek-V3, das Training mit nur 2.048 GPUs in weniger als zwei Monaten abzuschließen, bei Gesamtkosten von 5,5 Millionen Dollar - etwa ein Zwanzigstel der Trainingskosten von GPT-4o.
Ein junges Innovationsteam
DeepSeek verfügt über ein charakteristisches Forschungsteam. Kernpositionen sind hauptsächlich mit Hochschulabsolventen und Mitarbeitern mit 1-2 Jahren Erfahrung besetzt, während Teamleiter typischerweise 4-6 Jahre Erfahrung haben. Diese jungen Talente von Spitzenuniversitäten wie Tsinghua und Peking University gedeihen in der flachen Managementstruktur und innovativen Atmosphäre des Unternehmens.
Bei DeepSeek kann jeder ohne Genehmigung frei auf Trainingscluster-Ressourcen zugreifen. Wenn ein Forscher eine Idee hat, kann er sofort Teams mit interessierten Kollegen bilden. Dieser flexible Innovationsmechanismus hat die Realisierung zahlreicher bahnbrechender Ideen ermöglicht.
Open-Source-Philosophie
Als innovatives Unternehmen unter dem Dach von HuanFang Technology hat DeepSeek die praktischen Innovationsgene seiner Muttergesellschaft geerbt und dabei eigene Charakteristika entwickelt. Das Unternehmen verfolgt einen Open-Source-Ansatz und ist überzeugt, dass geschlossene Systeme angesichts disruptiver Technologie nur temporäre Vorteile bieten.
DeepSeek verankert seinen Wert im Team und fördert die Entwicklung des gesamten KI-Ökosystems durch Open Source. Liang Wenfeng ist überzeugt: "Open Source ist mehr ein kulturelles als ein kommerzielles Verhalten. Geben ist eine zusätzliche Ehre."
Globale technische Ambitionen
In einer von Silicon Valley dominierten KI-Welle bietet DeepSeek einen seltenen Gegenentwurf. Seine MLA-Architekturinnovation wurde vom Chefanalysten von SemiAnalysis als "möglicherweise das beste Paper des Jahres" gelobt, während ehemalige OpenAI-Mitarbeiter das "erstaunlich kluge" Trainingssetup würdigten.
Als wichtige KI-Initiative von HuanFang Technology zeigt DeepSeek, dass chinesische Technologieunternehmen durchaus in der Lage sind, an der Spitze globaler Innovation mitzuwirken. Von reinen Technologienachahmern zu aktiven Innovationsbeitragenden schreibt dieses junge Unternehmen ein neues Kapitel in Chinas KI-Industrie.
Zukunftsaussichten
DeepSeek strebt an, ein führender globaler Anbieter von Grundlagenmodellen zu werden. Das Unternehmen hofft, durch kontinuierliche technologische Innovation eine vollständige industrielle Ökologie zu schaffen, die es mehr Unternehmen ermöglicht, B2B- und B2C-Geschäfte auf DeepSeeks Grundlage aufzubauen.
Von den Wurzeln im quantitativen Handel von HuanFang Technology bis zur heutigen Expansion an der KI-Grenze verkörpert DeepSeek die Evolution chinesischer Technologieunternehmen. Diese Geschichte entwickelt sich weiter, und die Kombination von HuanFang Technology und DeepSeek wird zweifellos ein bemerkenswertes Kapitel in der KI-Ära schreiben.