DeepSeek 是哪个公司的:深度解析幻方科技的 AI 新星

DeepSeek(深度求索)是由幻方科技创立的人工智能公司,专注于大语言模型的研发和创新。公司由幻方科技创始人梁文锋创立,是中国大模型领域极少数专注于基础研究的公司之一。

母公司背景:幻方科技

幻方科技是中国领先的量化私募基金公司:

  • 成立于2016年
  • 总部位于杭州
  • 在AI和量化交易领域有深厚积累
  • 提前储备万张A100芯片用于AI研发

DeepSeek核心技术突破

创新架构

DeepSeek在模型架构上实现重大突破:

  • MLA(多头潜在注意力机制)架构,降低显存占用5%-13%
  • DeepSeekMoE架构实现计算量优化
  • 训练效率提升至业界领先水平

成本优势

通过技术创新大幅降低成本:

  • DeepSeek-V3训练成本仅550万美元
  • 仅用2048块GPU,训练时间不到2个