DeepSeek V3

DeepSeek V3: نموذج لغة ذكاء اصطناعي متقدم بـ 671B معلمة

اختبر الجيل القادم من نماذج اللغة مع كفاءة غير مسبوقة في الاستدلال والبرمجة والحسابات الرياضية

671B معلمة
برمجة متقدمة
تدريب فعال

دمج مجاني في موقعك

هل لديك موقع إلكتروني؟ قم بتضمين واجهة المحادثة لدينا مجانًا باستخدام كود iframe بسيط. لا يتطلب التسجيل.

<iframe src="https://www.deepseekv3.com/embed" width="100%" height="600px" frameborder="0"></iframe>

جرب DeepSeek Chat مجاناً بدون تسجيل

الميزات الرئيسية

اكتشف القدرات القوية التي تميز DeepSeek V3

هندسة MoE المتقدمة

نموذج ثوري بـ 671B معلمة مع تنشيط 37B فقط لكل رمز، مع تحقيق الكفاءة المثلى من خلال موازنة الحمل المبتكرة

  • الانتباه الكامن متعدد الرؤوس (MLA)
  • موازنة الحمل بدون خسارة إضافية
  • هندسة DeepSeekMoE
  • هدف التنبؤ متعدد الرموز

أداء متطور

نتائج استثنائية في العديد من المقاييس بما في ذلك MMLU (87.1%)، BBH (87.5%)، ومهام الاستدلال الرياضي

  • أعلى الدرجات في مسابقات البرمجة
  • حسابات رياضية متقدمة
  • قدرات متعددة اللغات
  • مهام الاستدلال المعقدة

تدريب فعال

نهج تدريب مبتكر يتطلب فقط 2.788M ساعة H800 GPU، مع كفاءة تكلفة ملحوظة تبلغ 5.5 مليون دولار

  • تدريب بدقة مختلطة FP8
  • إطار تدريب محسن
  • عملية تدريب مستقرة
  • لا حاجة للتراجع

نشر متعدد الاستخدامات

خيارات نشر متعددة تدعم NVIDIA وAMD GPUs وHuawei Ascend NPUs للتكامل المرن

  • جاهز للنشر السحابي
  • دعم الاستدلال المحلي
  • منصات أجهزة متعددة
  • خيارات خدمة محسنة

قدرات برمجة متقدمة

أداء متفوق في مهام البرمجة، متفوق في كل من البرمجة التنافسية وسيناريوهات التطوير الواقعية

  • دعم لغات متعددة
  • إكمال الكود
  • اكتشاف الأخطاء
  • تحسين الكود

أمان جاهز للمؤسسات

تدابير أمنية شاملة وميزات امتثال للنشر والتكامل المؤسسي

  • التحكم في الوصول
  • تشفير البيانات
  • تسجيل التدقيق
  • جاهز للامتثال

بيانات تدريب واسعة

تم التدريب المسبق على 14.8T من الرموز المتنوعة وعالية الجودة، مما يضمن معرفة وقدرات واسعة

  • مصادر بيانات متنوعة
  • محتوى مفلتر الجودة
  • مجالات متعددة
  • تحديثات منتظمة

ريادة الابتكار

تقدم رائد في تقنية الذكاء الاصطناعي من خلال التعاون المفتوح والابتكار المستمر

  • ريادة البحث
  • تعاون مفتوح
  • مدفوع بالمجتمع
  • تحسينات منتظمة

التغطية الإعلامية

ما تقوله وسائل الإعلام عن DeepSeek V3

أداء متميز

يتفوق DeepSeek V3 على نماذج الذكاء الاصطناعي المفتوحة والمغلقة في مسابقات البرمجة، خاصة في مسابقات Codeforces واختبارات Aider Polyglot.

نطاق هائل

تم بناؤه بـ 671 مليار معلمة وتدريبه على 14.8 تريليون رمز، مما يجعله أكبر بـ 1.6 مرة من نموذج Meta's Llama 3.1 405B.

تطوير فعال التكلفة

تم تدريبه في شهرين فقط باستخدام وحدات معالجة الرسومات Nvidia H800، بتكلفة تطوير فعالة تبلغ 5.5 مليون دولار.

DeepSeek V3 في العمل

شاهد كيف يحدث DeepSeek V3 ثورة في قدرات الذكاء الاصطناعي مفتوح المصدر

DeepSeek V3: ذكاء اصطناعي مفتوح المصدر ثوري

نظرة متعمقة على قدرات وأداء DeepSeek V3 مقارنة بنماذج الذكاء الاصطناعي الرائدة الأخرى.

مقاييس أداء DeepSeek V3

فهم اللغة في DeepSeek V3

MMLU87.1%
BBH87.5%
DROP89.0%

البرمجة في DeepSeek V3

HumanEval65.2%
MBPP75.4%
CRUXEval68.5%

الرياضيات في DeepSeek V3

GSM8K89.3%
MATH61.6%
CMath90.7%

المواصفات التقنية

استكشف القدرات التقنية المتقدمة والبنية التي تدعم DeepSeek V3

تفاصيل البنية التقنية لـ DeepSeek V3

بنية عصبية متقدمة مصممة للأداء والكفاءة المثلى

671 مليار معلمة إجمالية مع تنشيط ديناميكي لـ 37 مليار لكل رمز
الانتباه الكامن متعدد الرؤوس (MLA) لفهم السياق المعزز
بنية DeepSeekMoE مع شبكات خبيرة متخصصة
موازنة الحمل بدون خسارة إضافية للاستخدام الأمثل للموارد
هدف تدريب التنبؤ متعدد الرموز لتحسين الكفاءة
آلية تبديل متناثرة مبتكرة
تقنيات مشاركة المعلمات المتقدمة
نظام إدارة ذاكرة محسن

أبحاث DeepSeek V3

دفع حدود قدرات نماذج اللغة

بنية مبتكرة

بنية مبتكرة لمزيج من الخبراء (MoE) مع استراتيجية موازنة الحمل بدون خسارة إضافية

منهجية التدريب

إطار تدريب متقدم بدقة مختلطة FP8 تم التحقق من صحته في تدريب النماذج واسعة النطاق

الورقة التقنية

اقرأ ورقتنا التقنية الشاملة التي تفصل البنية وعملية التدريب ونتائج تقييم DeepSeek V3.

قراءة الورقة

عن DeepSeek

ريادة مستقبل تطوير الذكاء الاصطناعي مفتوح المصدر

خلفية الشركة

بدعم من High-Flyer Capital Management، تهدف DeepSeek إلى تحقيق تقدم ثوري في تقنية الذكاء الاصطناعي من خلال التعاون والابتكار المفتوح.

البنية التحتية

باستخدام مجموعات حوسبة متقدمة تشمل 10,000 وحدة معالجة رسومات Nvidia A100، تظهر DeepSeek قدرات استثنائية في تدريب النماذج واسعة النطاق.

تحميل نماذج DeepSeek V3

اختر بين الإصدار الأساسي والإصدار المحسن للمحادثة من DeepSeek V3

نموذج DeepSeek V3 الأساسي

النموذج الأساسي مع 671 مليار معامل (37 مليار نشط)

الحجم: 685GB
  • تم التدريب المسبق على 14.8 تريليون رمز
  • طول السياق 128K
  • أوزان FP8
  • 671 مليار معامل إجمالي
تحميل النموذج الأساسي

نموذج DeepSeek V3 للمحادثة

نموذج محسن مخصص للحوار والتفاعل

الحجم: 685GB
  • تحسين القدرة على الاستنتاج
  • طول السياق 128K
  • تحسين اتباع التعليمات
  • 671 مليار معامل إجمالي
تحميل نموذج المحادثة

تعليمات التثبيت

التحميل باستخدام Git LFS (الطريقة الموصى بها):

# For Base Model
git lfs install
git clone https://huggingface.co/deepseek-ai/DeepSeek-V3-Base

# For Chat Model
git lfs install
git clone https://huggingface.co/deepseek-ai/DeepSeek-V3

خيارات نشر DeepSeek V3

النشر المحلي لـ DeepSeek V3

تشغيل محلي مع عرض DeepSeek-Infer يدعم استدلال FP8 وBF16

  • إعداد بسيط
  • عرض توضيحي خفيف
  • خيارات دقة متعددة

تكامل السحابة لـ DeepSeek V3

نشر على منصات السحابة مع دعم SGLang وLMDeploy

  • نشر سحابي أصيل
  • بنية تحتية قابلة للتوسع
  • جاهز للمؤسسات

دعم الأجهزة لـ DeepSeek V3

متوافق مع وحدات معالجة الرسومات NVIDIA وAMD ووحدات معالجة الأعصاب Huawei Ascend

  • دعم متعدد الموردين
  • أداء محسن
  • نشر مرن

كيفية استخدام DeepSeek V3

ابدأ المحادثة مع DeepSeek V3 في ثلاث خطوات بسيطة

الخطوة 1

زيارة صفحة المحادثة

انقر على زر "جرب المحادثة" في أعلى الصفحة للدخول إلى واجهة المحادثة

الخطوة 2

أدخل سؤالك

اكتب سؤالك في مربع إدخال المحادثة

الخطوة 3

انتظر الرد

سيقوم DeepSeek V3 بإنشاء رد سريع، عادةً في غضون ثوانٍ

الأسئلة الشائعة

إجابات على الأسئلة الأكثر شيوعاً حول DeepSeek V3

ما هو DeepSeek V3؟

DeepSeek V3 هو نموذج لغة متقدم مفتوح المصدر يدعم المحادثة والبرمجة والمهام المتعددة. تم تطويره باستخدام أحدث تقنيات الذكاء الاصطناعي.

كيف يمكنني استخدام DeepSeek V3؟

يمكنك استخدام DeepSeek V3 من خلال واجهة المحادثة المباشرة على موقعنا، أو عبر واجهة برمجة التطبيقات (API)، أو من خلال تنزيل النموذج واستخدامه محلياً.

هل DeepSeek V3 مجاني للاستخدام؟

نعم، DeepSeek V3 مفتوح المصدر ومجاني للاستخدام. يمكنك استخدامه في مشاريعك الشخصية والتجارية مع الالتزام بشروط الترخيص.

ما هي متطلبات النظام لتشغيل DeepSeek V3 محلياً؟

لتشغيل DeepSeek V3 محلياً، تحتاج إلى جهاز حاسوب بمواصفات جيدة ومعالج رسومات متوافق. راجع وثائقنا التقنية للحصول على التفاصيل الكاملة.

ابدأ مع DeepSeek V3

جرب واجهة برمجة تطبيقات DeepSeek V3

الوصول إلى وظائف DeepSeek V3 من خلال منصة API سهلة الاستخدام للمطورين

ابدأ البناء

استكشف على GitHub

الوصول إلى الكود المصدري والوثائق والمساهمة في DeepSeek V3

عرض المستودع

جرب محادثة DeepSeek V3

اختبر قدرات DeepSeek V3 مباشرة من خلال واجهة المحادثة التفاعلية

بدء المحادثة