DeepSeek(深度求索)是由幻方科技创立的人工智能公司,专注于大语言模型的研发和创新。公司由幻方科技创始人梁文锋创立,是中国大模型领域极少数专注于基础研究的公司之一。
母公司背景:幻方科技
幻方科技是中国领先的量化私募基金公司:
- 成立于2016年
- 总部位于杭州
- 在AI和量化交易领域有深厚积累
- 提前储备万张A100芯片用于AI研发
DeepSeek核心技术突破
创新架构
DeepSeek在模型架构上实现重大突破:
- MLA(多头潜在注意力机制)架构,降低显存占用5%-13%
- DeepSeekMoE架构实现计算量优化
- 训练效率提升至业界领先水平
成本优势
通过技术创新大幅降低成本:
- DeepSeek-V3训练成本仅550万美元
- 仅用2048块GPU,训练时间不到2个