¿A qué empresa pertenece DeepSeek?: Una empresa pionera de IA de HuanFang Technology

A principios de 2025, cuando DeepSeek-V3 asombró a la comunidad global de IA con su eficiencia de entrenamiento sin precedentes, esta joven empresa de IA volvió a captar la atención mundial. Como subsidiaria de HuanFang Technology, DeepSeek ha pasado de ser una startup desconocida a un líder tecnológico global en tan solo dieciocho meses.

HuanFang Technology: Del Trading Cuantitativo a la Innovación en IA

En el Edificio Internacional Huijin de Hangzhou, con vistas al histórico Gran Canal, un equipo liderado por el fundador nacido en los 80, Liang Wenfeng, está orquestando una revolución tecnológica. Este es el lugar de nacimiento de DeepSeek, surgiendo del gigante del trading cuantitativo HuanFang Technology.

Fundada en 2016, HuanFang Technology se estableció como el principal fondo de cobertura cuantitativo de China. Aprovechando su profunda experiencia en IA y trading cuantitativo, la empresa comenzó a posicionarse para entrar en el espacio de modelos de lenguaje grande desde 2022. Durante la grave escasez de chips, HuanFang aseguró previsoramente 10,000 GPUs A100, sentando una base sólida para el nacimiento de DeepSeek.

Un Enfoque Técnico Único: Enfoque en la Innovación Original

A diferencia de otras empresas chinas de IA, DeepSeek eligió un camino de desarrollo distintivo. El fundador Liang Wenfeng cree firmemente que las empresas chinas de IA no deberían permanecer como seguidores perpetuos, sino contribuir a la ola global de innovación tecnológica.

Esta creencia se refleja en cada decisión importante de la empresa. Entre las siete principales startups de modelos de IA de China, DeepSeek es la única en su enfoque exclusivo en investigación y tecnología sin perseguir aplicaciones de consumo. También es la única empresa que no ha priorizado la comercialización, manteniéndose firmemente comprometida con el código abierto mientras evita la financiación externa.

Innovaciones Técnicas Revolucionarias

Las innovaciones técnicas de DeepSeek se manifiestan principalmente en dos áreas: innovación arquitectónica y avances en metodología de entrenamiento.

Arquitectónicamente, el mecanismo pionero MLA (Atención Latente Multi-cabezal) reduce el uso de memoria al 5-13% de la arquitectura MHA tradicional. Esta innovación surgió de la visión de un joven investigador y se realizó a través de meses de esfuerzo en equipo. Además, la arquitectura DeepSeekMoE reduce dramáticamente los requisitos computacionales.

En metodología de entrenamiento, DeepSeek fue pionera en el entrenamiento de precisión mixta FP8 con estrategias optimizadas de procesamiento de datos. Estas innovaciones permitieron que DeepSeek-V3 completara el entrenamiento con solo 2,048 GPUs en menos de dos meses, con un costo total de $5.5 millones - aproximadamente una vigésima parte del costo de entrenamiento de GPT-4.

Un Joven Equipo de Innovación

DeepSeek cuenta con un equipo de investigación distintivo. Los puestos técnicos centrales están ocupados principalmente por graduados recientes y aquellos con 1-2 años de experiencia, mientras que los líderes de equipo típicamente tienen 4-6 años de experiencia. Estos jóvenes talentos de las principales universidades como Tsinghua y Peking University prosperan en la estructura de gestión plana y la atmósfera innovadora de la empresa.

En DeepSeek, cualquiera puede acceder libremente a los recursos del clúster de entrenamiento sin aprobación. Cuando un investigador tiene una idea, puede formar inmediatamente equipos con colegas interesados. Este mecanismo flexible de innovación ha permitido que numerosas ideas revolucionarias se materialicen.

Filosofía Técnica de Código Abierto

Como empresa innovadora incubada por HuanFang Technology, DeepSeek heredó los genes de innovación práctica de su empresa matriz mientras desarrollaba sus propias características. La empresa mantiene un enfoque de código abierto, creyendo que los fosos formados por sistemas cerrados son temporales frente a la tecnología disruptiva.

DeepSeek incorpora valor en su equipo, promoviendo el desarrollo de todo el ecosistema de IA a través del código abierto. Liang Wenfeng cree que "el código abierto es más un comportamiento cultural que comercial. Dar es un honor adicional."

Ambiciones Técnicas Globales

En una ola de IA impulsada en gran parte por Silicon Valley, DeepSeek proporciona un caso inverso poco común. Su innovación en arquitectura MLA fue elogiada por el analista jefe de SemiAnalysis como "potencialmente el mejor paper de este año", mientras que ex empleados de OpenAI elogiaron su "increíblemente sabia" configuración de entrenamiento.

Como iniciativa clave de IA de HuanFang Technology, DeepSeek está demostrando que las empresas tecnológicas chinas son plenamente capaces de contribuir en la frontera de la innovación global. De simples seguidores tecnológicos a contribuyentes activos de innovación, esta joven empresa está escribiendo un nuevo capítulo en la industria china de IA.

Perspectivas Futuras

Mirando hacia adelante, DeepSeek aspira a convertirse en un proveedor global líder de modelos base. La empresa espera formar una ecología industrial completa a través de la innovación tecnológica continua, permitiendo que más empresas construyan negocios B2B y B2C sobre la base de DeepSeek.

Desde las raíces del trading cuantitativo de HuanFang Technology hasta su actual expansión en la frontera de la IA, DeepSeek ejemplifica la evolución de las empresas tecnológicas chinas del 1 al N, y luego del 0 al 1. Esta historia continúa desarrollándose, y la combinación de HuanFang Technology y DeepSeek sin duda escribirá un capítulo notable en la era de la IA.