DeepSeek V3

DeepSeek V3：6,710億パラメータを持つ先進的なAI言語モデル

推論、プログラミング、数学計算における次世代言語モデルの革新的な効率性を体験

6,710億パラメータ

高度なプログラミング

効率的なトレーニング

DeepSeek V3を試す APIにアクセス

無料ウェブサイト統合

ウェブサイトをお持ちですか？簡単なiframeコードで無料でチャットインターフェースを埋め込めます。登録不要。

登録不要でDeepSeekチャットを試す

DeepSeekチャット

主な機能

DeepSeek V3の革新的な機能を探る

先進的なMoEアーキテクチャ

革新的な6,710億パラメータモデルで、各トークンあたり370億パラメータのみを活性化し、革新的な負荷分散で最適な効率を実現

•マルチヘッド潜在的注意（MLA）
•補助損失のない負荷分散
•DeepSeekMoEアーキテクチャ
•マルチトークン予測目標

最先端の性能

MMLU (87.1%)、BBH (87.5%)、数学的推論タスクなど、多くのベンチマークで卓越した成果を達成

•プログラミングコンテスト最高得点
•高度な数学計算
•多言語対応
•複雑な推論タスク

効率的なトレーニング

革新的なトレーニング手法により、H800 GPUで278.8万時間のみ必要で、コスト効率が大幅に向上し、550万ドルのみで実現

•FP8混合精度トレーニング
•最適化されたトレーニングフレームワーク
•安定したトレーニングプロセス
•ロールバック不要

柔軟なデプロイメント

NVIDIA、AMD GPU、Huawei Ascend NPUに対応した多様なデプロイメントオプションで柔軟な統合を実現

•クラウドデプロイメント対応
•ローカル推論サポート
•マルチハードウェアプラットフォーム
•最適化されたサービスオプション

高度なプログラミング能力

プログラミングタスクで優れた性能を発揮し、競技プログラミングと実際の開発シナリオの両方で卓越した成果を達成

•多言語サポート
•コード補完
•エラー検出
•コード最適化

エンタープライズセキュリティ

企業のデプロイメントと統合に適した包括的なセキュリティ対策とコンプライアンス機能

•アクセス制御
•データ暗号化
•監査ログ
•コンプライアンス対応

大規模トレーニングデータ

14.8兆の多様で高品質なトークンでの事前トレーニングにより、幅広い知識と能力を確保

•多様なデータソース
•品質フィルタリング
•多分野カバレッジ
•定期的な更新

イノベーションリーダーシップ

オープンコラボレーションと継続的なイノベーションを通じて、AI技術の進歩をリード

•研究リーダーシップ
•オープンコラボレーション
•コミュニティ主導
•継続的な改善

メディアが注目するDeepSeek V3

オープンソースAI開発の新たなブレークスルー

画期的な性能

DeepSeek V3は、特にCodeforcesコンテストとAider Polyglotテストにおいて、オープンソースとクローズドソースの両方のAIモデルを凌駕する性能を示しています。

大規模アーキテクチャ

6,710億パラメータを持ち、14.8兆トークンで訓練され、MetaのLlama 3.1 405Bの1.6倍の規模を誇ります。

効率的な開発コスト

Nvidia H800 GPUを使用してわずか2ヶ月で訓練を完了し、開発コストはわずか550万ドルでした。

DeepSeek V3 実演デモ

DeepSeek V3がオープンソースAIの能力をどのように革新するかをご覧ください

DeepSeek V3：革新的なオープンソースAI

DeepSeek V3の能力と他の主要AIモデルとの性能比較について詳しく見てみましょう。

DeepSeek V3 性能指標

DeepSeek V3 言語理解

MMLU87.1%

BBH87.5%

DROP89.0%

DeepSeek V3 プログラミング

HumanEval65.2%

MBPP75.4%

CRUXEval68.5%

DeepSeek V3 数学

GSM8K89.3%

MATH61.6%

CMath90.7%

技術仕様

DeepSeek V3を支える先進的な技術能力とアーキテクチャを探る

DeepSeek V3 アーキテクチャの詳細

最高のパフォーマンスと効率性のために設計された先進的なニューラルネットワークアーキテクチャ

•6,710億総パラメータ、各トークンで370億パラメータを動的に活性化

•マルチヘッド潜在的注意（MLA）メカニズムによるコンテキスト理解の向上

•専門家ネットワークを備えたDeepSeekMoEアーキテクチャ

•最適なリソース利用のための補助損失のない負荷分散

•効率性を高めるマルチトークン予測目標

•革新的なスパースゲーティングメカニズム

•先進的なパラメータ共有技術

•最適化されたメモリ管理システム

DeepSeek V3 研究

言語モデルの能力の限界を押し広げる

革新的アーキテクチャ

革新的なMixture of Experts（MoE）アーキテクチャ、補助損失のない負荷分散戦略を採用

トレーニング手法

先進的なFP8混合精度トレーニングフレームワーク、大規模モデルトレーニングで実証済み

技術論文

DeepSeek V3のアーキテクチャ、トレーニングプロセス、評価結果を詳細に説明した技術論文をご覧ください。

論文を読む

DeepSeekについて

オープンソースAI開発の未来を切り開く

企業背景

Hillhouse Capitalの支援を受け、DeepSeekはオープンコラボレーションとイノベーションを通じてAI技術のブレークスルーを実現することに取り組んでいます。

インフラストラクチャ

DeepSeekは10,000台のNvidia A100 GPUを含む先進的な計算クラスターを保有し、大規模モデルトレーニングにおいて卓越した能力を示しています。

DeepSeek V3 モデルのダウンロード

DeepSeek V3のベースバージョンまたは対話最適化バージョンを選択

DeepSeek V3 ベースモデル

6,710億パラメータ（370億アクティブ）を持つベースモデル

サイズ: 685GB

•14.8兆トークンで事前学習
•128Kコンテキスト長
•FP8ウェイト
•6,710億総パラメータ

ベースモデルをダウンロード

DeepSeek V3 チャットモデル

対話と相互作用に最適化されたファインチューニングモデル

サイズ: 685GB

•強化された推論能力
•128Kコンテキスト長
•改善された指示追従
•6,710億総パラメータ

チャットモデルをダウンロード

インストール手順

Git LFSを使用したダウンロード（推奨方法）：

# For Base Model
git lfs install
git clone https://huggingface.co/deepseek-ai/DeepSeek-V3-Base

# For Chat Model
git lfs install
git clone https://huggingface.co/deepseek-ai/DeepSeek-V3

ベースモデルを表示チャットモデルを表示

DeepSeek V3 デプロイメントオプション

DeepSeek V3 ローカルデプロイメント

DeepSeek-Infer Demoを使用してローカルで実行、FP8とBF16推論をサポート

簡単なセットアップ
軽量デモ
複数の精度オプション

DeepSeek V3 クラウド統合

SGLangとLMDeployを通じてクラウドプラットフォームへのデプロイをサポート

クラウドネイティブデプロイメント
スケーラブルなインフラ
エンタープライズ対応

DeepSeek V3 ハードウェアサポート

NVIDIA、AMD GPU、Huawei Ascend NPUに対応

マルチベンダーサポート
パフォーマンス最適化
柔軟なデプロイメント

DeepSeek V3の使い方

3つの簡単なステップでDeepSeek V3との対話を始めましょう

ステップ 1

チャットページにアクセス

ページ上部の"Try Chat"ボタンをクリックしてチャットインターフェースに入ります

ステップ 2

質問を入力

チャット入力ボックスに質問を入力してください

ステップ 3

応答を待つ

DeepSeek V3は通常数秒で素早く回答を生成します

今すぐ対話を始める

よくある質問

DeepSeek V3についてもっと知る

DeepSeek V3の特徴は何ですか？

DeepSeek V3は671Bパラメータのモデルを採用し、マルチトークン予測や補助損失のない負荷分散などの革新的な機能を組み合わせ、様々なタスクで優れたパフォーマンスを発揮します。

DeepSeek V3にはどうやってアクセスできますか？

オンラインデモプラットフォームやAPIサービスを通じてDeepSeek V3を利用できます。また、モデルの重みをダウンロードしてローカルに展開することもできます。

DeepSeek V3はどのようなタスクで優れていますか？

DeepSeek V3は数学、プログラミング、推論、多言語タスクで優れた性能を発揮し、ベンチマーク評価で常にトップスコアを獲得しています。

DeepSeek V3を実行するためのハードウェア要件は何ですか？

DeepSeek V3は、NVIDIA GPU、AMD GPU、Huawei Ascend NPUなど、様々な展開オプションをサポートし、最適なパフォーマンスを実現するための複数のフレームワークを提供しています。

DeepSeek V3は商用利用できますか？

はい、DeepSeek V3は商用利用が可能です。具体的な利用条件についてはモデルライセンス契約をご参照ください。

DeepSeek V3は他の言語モデルと比べてどうですか？

DeepSeek V3は様々なベンチマークで他のオープンソースモデルを上回り、主要な非公開モデルと同等のパフォーマンスを達成しています。

DeepSeek V3はどのような展開フレームワークをサポートしていますか？

DeepSeek V3は、SGLang、LMDeploy、TensorRT-LLM、vLLMなど、様々なフレームワークを使用して展開でき、FP8およびBF16推論モードをサポートしています。

DeepSeek V3のコンテキストウィンドウサイズはどれくらいですか？

DeepSeek V3は128Kのコンテキストウィンドウを持ち、複雑なタスクや長文コンテンツを効果的に処理し理解することができます。

DeepSeek V3 を始める

DeepSeek V3 APIを試す

開発者フレンドリーなAPIプラットフォームを通じてDeepSeek V3の機能にアクセス

構築を開始

GitHubで探索

ソースコード、ドキュメントにアクセスし、DeepSeek V3に貢献

リポジトリを表示

DeepSeek V3チャットを試す

インタラクティブなチャットインターフェースを通じてDeepSeek V3の機能を直接体験

チャットを開始