Début 2025, DeepSeek-V3 a stupéfié la communauté mondiale de l'IA avec son efficacité d'entraînement sans précédent. Filiale de HuanFang Technology, DeepSeek s'est transformée en dix-huit mois d'une start-up inconnue en un leader technologique mondial.
HuanFang Technology : Du trading quantitatif à l'innovation en IA
Dans le bâtiment Huijin International de Hangzhou, surplombant le Grand Canal historique, une équipe dirigée par Liang Wenfeng, né dans les années 80, orchestre une révolution technologique. C'est ici qu'est né DeepSeek, issu du géant du trading quantitatif HuanFang Technology.
Fondée en 2016, HuanFang Technology s'est imposée comme le principal fonds spéculatif quantitatif de Chine. Capitalisant sur son expertise en IA et en trading quantitatif, l'entreprise a commencé à se positionner dans le domaine des grands modèles de langage dès 2022. Pendant la pénurie de puces, HuanFang a acquis avec prévoyance 10 000 GPU A100, posant les bases de la création de DeepSeek.
Une approche technique unique
Contrairement aux autres entreprises chinoises d'IA, DeepSeek a choisi une voie de développement distinctive. Le fondateur Liang Wenfeng croit fermement que les entreprises chinoises d'IA ne doivent pas rester de perpétuels suiveurs mais contribuer à l'innovation technologique mondiale.
Cette conviction se reflète dans chaque décision majeure de l'entreprise. Parmi les sept principales start-ups chinoises de modèles d'IA, DeepSeek est la seule à se concentrer exclusivement sur la recherche et la technologie, sans poursuivre d'applications grand public. C'est également la seule entreprise qui n'a pas priorisé la commercialisation, optant résolument pour l'open source sans rechercher de financement externe.
Innovations techniques révolutionnaires
Les innovations techniques de DeepSeek se manifestent principalement dans deux domaines : l'innovation architecturale et les avancées dans la méthodologie d'entraînement.
L'architecture MLA (Multi-head Latent Attention) pionnière réduit l'utilisation de la mémoire à 5-13% de l'architecture MHA traditionnelle. Cette innovation, née de l'intuition d'un jeune chercheur, a été réalisée grâce à des mois d'efforts d'équipe. De plus, l'architecture DeepSeekMoE réduit drastiquement les besoins en calcul.
En matière de méthodologie d'entraînement, DeepSeek a innové avec l'entraînement en précision mixte FP8 et des stratégies optimisées de traitement des données. Ces innovations ont permis à DeepSeek-V3 de terminer l'entraînement avec seulement 2 048 GPU en moins de deux mois, pour un coût total de 5,5 millions de dollars - environ un vingtième du coût d'entraînement de GPT-4o.
Une jeune équipe d'innovation
DeepSeek dispose d'une équipe de recherche caractéristique. Les postes techniques clés sont principalement occupés par des diplômés récents et des personnes ayant 1-2 ans d'expérience, tandis que les chefs d'équipe ont généralement 4-6 ans d'expérience. Ces jeunes talents des meilleures universités comme Tsinghua et l'Université de Pékin s'épanouissent dans la structure de gestion horizontale et l'atmosphère innovante de l'entreprise.
Chez DeepSeek, chacun peut accéder librement aux ressources des clusters d'entraînement sans approbation. Lorsqu'un chercheur a une idée, il peut immédiatement former des équipes avec des collègues intéressés. Ce mécanisme d'innovation flexible a permis la concrétisation de nombreuses idées révolutionnaires.
Philosophie open source
En tant qu'entreprise innovante incubée par HuanFang Technology, DeepSeek a hérité des gènes d'innovation pratique de sa société mère tout en développant ses propres caractéristiques. L'entreprise maintient une approche open source, estimant que les avantages des systèmes fermés sont temporaires face à la technologie disruptive.
DeepSeek ancre sa valeur dans son équipe, promouvant le développement de l'ensemble de l'écosystème IA par l'open source. Liang Wenfeng considère que "l'open source est davantage un comportement culturel que commercial. Donner est un honneur supplémentaire."
Ambitions techniques mondiales
Dans un secteur de l'IA largement dominé par la Silicon Valley, DeepSeek offre un rare contre-exemple. Son innovation architecturale MLA a été saluée par l'analyste en chef de SemiAnalysis comme "potentiellement le meilleur article de l'année", tandis que d'anciens employés d'OpenAI ont loué son approche d'entraînement "étonnamment judicieuse".
En tant qu'initiative clé de HuanFang Technology dans l'IA, DeepSeek démontre que les entreprises technologiques chinoises sont pleinement capables de contribuer à la frontière de l'innovation mondiale. De simples suiveurs technologiques à contributeurs actifs de l'innovation, cette jeune entreprise écrit un nouveau chapitre dans l'industrie chinoise de l'IA.
Perspectives d'avenir
DeepSeek aspire à devenir un leader mondial des modèles fondamentaux. L'entreprise espère créer une écologie industrielle complète grâce à l'innovation technologique continue, permettant à davantage d'entreprises de construire des activités B2B et B2C sur la base de DeepSeek.
Des racines dans le trading quantitatif de HuanFang Technology à l'expansion actuelle aux frontières de l'IA, DeepSeek illustre l'évolution des entreprises technologiques chinoises. Cette histoire continue de se développer, et la combinaison de HuanFang Technology et DeepSeek écrira sans aucun doute un chapitre remarquable dans l'ère de l'IA.