مؤخرا، أصدرت DeepSeek تحديث النسخة V3 - DeepSeek-V3-0324، حيث وصلت معلمات النموذج إلى 6850 مليار، مع تحسينات ملحوظة في قدرات البرمجة وتصميم واجهة المستخدم وقدرات الاستدلال.
في مؤتمر GTC 2025 الذي انتهى مؤخرًا، أشاد التنفيذيون بـ DeepSeek، مشيرين في الوقت نفسه إلى أن السوق كان يعتقد سابقًا أن النموذج الفعال لـ DeepSeek سيقلل من الفهم حول الطلب على الرقائق، وهذا اعتقاد خاطئ، حيث إن الطلب على الحوسبة في المستقبل سيكون أكثر، وليس أقل.
يعتبر DeepSeek كمنتج يمثل突破ًا في الخوارزمية، وقد أثارت العلاقة بينه وبين موردي الشرائح تفكير الناس حول دور القوة الحاسوبية والخوارزمية في تطوير الصناعة.
تفاعل تطور القوة الحاسوبية والخوارزمية
في مجال الذكاء الاصطناعي، فإن زيادة قوة الحوسبة توفر أساساً لتشغيل خوارزميات أكثر تعقيداً، مما يمكّن النماذج من معالجة كميات أكبر من البيانات، وتعلم أنماط أكثر تعقيداً؛ بينما يمكن أن تؤدي تحسينات الخوارزمية إلى استخدام أكثر كفاءة لقوة الحوسبة، مما يزيد من كفاءة استخدام موارد الحوسبة.
علاقة التعايش بين القدرة الحاسوبية والخوارزمية تعيد تشكيل مشهد صناعة الذكاء الاصطناعي:
تنوع المسارات التقنية: تسعى بعض الشركات لبناء تجمعات هائلة من القدرة الحاسوبية، بينما تركز أخرى على تحسين كفاءة الخوارزمية، مما يؤدي إلى تشكيل مدارس تقنية مختلفة.
إعادة هيكلة سلسلة الصناعة: بعض الشركات أصبحت رائدة في قوة الذكاء الاصطناعي من خلال النظام البيئي، بينما قامت شركات خدمات السحابة بتخفيض عتبة النشر من خلال خدمات القوة المرنة.
تعديل تخصيص الموارد: تسعى الشركات إلى تحقيق التوازن بين الاستثمار في البنية التحتية للأجهزة وتطوير الخوارزمية الفعالة.
ظهور مجتمع المصدر المفتوح: نماذج المصدر المفتوح مثل DeepSeek و LLaMA تتيح مشاركة ابتكارات الخوارزمية ونتائج تحسين القدرة الحاسوبية، مما يسرع من تكرار وتوزيع التكنولوجيا.
الابتكارات التكنولوجية لـ DeepSeek
نجاح DeepSeek لا ينفصل عن ابتكاراته التكنولوجية. فيما يلي شرح مبسط لنقاط الابتكار الرئيسية الخاصة به:
تحسين بنية النموذج
تعتمد DeepSeek على بنية مركبة من Transformer و MOE (خليط من الخبراء) ، وتقدم آلية الانتباه الكامنة متعددة الرؤوس (MLA). تشبه هذه البنية فريقًا خارقًا، حيث يتحمل Transformer المهام الاعتيادية، بينما يعمل MOE كمجموعة من الخبراء، حيث يتمتع كل خبير بمجال تخصصه الخاص، وعند مواجهة مشكلة معينة يتولى الخبير الأكثر كفاءة التعامل معها، مما يزيد بشكل كبير من كفاءة النموذج ودقته. تتيح آلية MLA للنموذج الانتباه بشكل أكثر مرونة إلى التفاصيل الهامة المختلفة أثناء معالجة المعلومات، مما يعزز الأداء بشكل أكبر.
طرق التدريب الإبداعية
قدمت DeepSeek إطار عمل لتدريب دقيق مختلط FP8. يعمل هذا الإطار كموارد ذكية لتوزيع الموارد، حيث يختار ديناميكياً دقة الحساب المناسبة بناءً على احتياجات مراحل التدريب المختلفة. عند الحاجة إلى دقة عالية، يتم استخدام دقة أعلى لضمان دقة النموذج؛ وعندما يمكن قبول دقة أقل، يتم تقليل الدقة لتوفير موارد الحساب، وزيادة سرعة التدريب، وتقليل استهلاك الذاكرة.
تحسين كفاءة الاستدلال
في مرحلة الاستدلال، قدمت DeepSeek تقنية التنبؤ المتعدد الرموز (Multi-token Prediction, MTP). حيث تتوقع الطرق التقليدية رمزًا واحدًا فقط في كل خطوة، بينما تستطيع تقنية MTP التنبؤ بعدة رموز مرة واحدة، مما يسرع بشكل كبير من سرعة الاستدلال ويخفض من تكاليفه.
###突破 الخوارزمية التعلم المعزز
خوارزمية GRPO (التحسين المعاقب على المكافآت العامة) الجديدة من DeepSeek تعزز عملية تدريب النماذج. التعلم المعزز يشبه تزويد النموذج بمدرب، حيث يوجه النموذج لتعلم سلوكيات أفضل من خلال المكافآت والعقوبات. الخوارزمية الجديدة من DeepSeek أكثر كفاءة، حيث تضمن تحسين أداء النموذج مع تقليل الحسابات غير الضرورية، مما يحقق توازنًا بين الأداء والتكلفة.
تشكل هذه الابتكارات نظامًا تقنيًا كاملاً، مما يقلل من متطلبات قوة الحوسبة عبر سلسلة كاملة من التدريب إلى الاستدلال. يمكن الآن لبطاقات الرسوميات الاستهلاكية العادية تشغيل نماذج الذكاء الاصطناعي القوية، مما يقلل بشكل كبير من عتبة دخول تطبيقات الذكاء الاصطناعي، ويتيح المزيد من المطورين والشركات المشاركة في الابتكار في مجال الذكاء الاصطناعي.
تأثير على موردي الرقائق
يعتقد الكثيرون أن DeepSeek قد تجاوزت بعض الطبقات الوسيطة، مما أخرجها من الاعتماد على مزودين معينين. في الواقع، تقوم DeepSeek بتحسين الخوارزمية مباشرة من خلال طبقة PTX (Parallel Thread Execution). PTX هي لغة تمثيل وسيطة تقع بين التعليمات البرمجية عالية المستوى وتعليمات GPU الفعلية، من خلال التلاعب بهذه الطبقة، يمكن لـ DeepSeek تحقيق تحسينات أكثر دقة في الأداء.
إن تأثير ذلك على موردي الرقائق ذو شقين. من ناحية، أصبحت DeepSeek مرتبطة بالأجهزة والنظام البيئي بشكل أعمق، وقد يؤدي انخفاض العوائق أمام تطبيقات الذكاء الاصطناعي إلى توسيع حجم السوق الكلي؛ من ناحية أخرى، قد تؤدي تحسينات الخوارزمية لـ DeepSeek إلى تغيير هيكل الطلب في السوق على الشرائح عالية الأداء، حيث قد تتمكن بعض نماذج الذكاء الاصطناعي التي كانت تحتاج سابقًا إلى وحدات معالجة الرسومات العليا من العمل بكفاءة الآن على وحدات معالجة الرسومات متوسطة المدى أو حتى الاستهلاكية.
معنى صناعة الذكاء الاصطناعي
توفير تحسين الخوارزمية من DeepSeek مسار تقني للاختراق في صناعة الذكاء الاصطناعي. في ظل قيود رقائق عالية الجودة، خفف مفهوم "البرمجيات تعوض عن الأجهزة" من الاعتماد على الرقائق المستوردة الرائدة.
في المنبع، خففت الخوارزمية الفعالة من ضغط الطلب على قوة الحوسبة، مما يمكّن مزودي خدمات الحوسبة من تمديد دورة استخدام الأجهزة من خلال تحسين البرمجيات، وزيادة العائد على الاستثمار. في المصب، خفّض النموذج المفتوح المصدر المحسّن من عتبة تطوير تطبيقات الذكاء الاصطناعي. العديد من الشركات الصغيرة والمتوسطة يمكنها تطوير تطبيقات تنافسية استنادًا إلى نموذج DeepSeek دون الحاجة إلى موارد كبيرة من قوة الحوسبة، مما سيؤدي إلى ظهور المزيد من حلول الذكاء الاصطناعي في مجالات عمودية.
التأثير العميق على Web3+AI
بنية تحتية للذكاء الاصطناعي اللامركزي
تحسين الخوارزمية لـ DeepSeek يوفر دافعاً جديداً للبنية التحتية للذكاء الاصطناعي في Web3. الهندسة المعمارية المبتكرة، الخوارزميات الفعالة واحتياجات القدرة الحاسوبية المنخفضة تجعل الاستدلال القائم على الذكاء الاصطناعي اللامركزي ممكناً. هيكل MoE مناسب بطبيعته للنشر الموزع، حيث يمكن أن تحتوي العقد المختلفة على شبكات خبراء مختلفة، دون الحاجة إلى تخزين نموذج كامل في عقدة واحدة، مما يقلل بشكل كبير من متطلبات التخزين والحساب لعقدة واحدة، ويزيد من مرونة وكفاءة النموذج.
إطار تدريب FP8 يقلل بشكل أكبر من الحاجة إلى موارد حسابية عالية الجودة، مما يسمح لمزيد من الموارد الحسابية بالانضمام إلى شبكة العقد. هذا لا يقلل فقط من عتبة المشاركة في حسابات الذكاء الاصطناعي اللامركزية، بل يزيد أيضًا من قدرة وكفاءة الحساب في الشبكة بأكملها.
نظام متعدد الوكلاء
تحسين استراتيجيات التداول الذكي: من خلال تحليل بيانات السوق في الوقت الحقيقي، وتوقع تقلبات الأسعار على المدى القصير، وتنفيذ الصفقات على السلسلة، ومراقبة نتائج التداول، تساعد العمليات التعاونية للوكيل المستخدمين في تحقيق عوائد أعلى.
التنفيذ التلقائي للعقود الذكية: التشغيل التعاوني للوكلاء مثل مراقبة العقود الذكية، والتنفيذ، والإشراف على النتائج، لتحقيق أتمتة منطق الأعمال الأكثر تعقيدًا.
إدارة المحافظ الاستثمارية الشخصية: تساعد الذكاء الاصطناعي المستخدمين في العثور على أفضل فرص الرهن أو توفير السيولة في الوقت الفعلي بناءً على تفضيلات المخاطر وأهداف الاستثمار والحالة المالية للمستخدم.
تبحث DeepSeek عن اختراقات من خلال الابتكار في الخوارزمية تحت قيود قوة الحوسبة، مما يفتح مسار تطوير متميز لصناعة الذكاء الاصطناعي. خفض عتبة التطبيق، وتعزيز دمج Web3 والذكاء الاصطناعي، وتقليل الاعتماد على الشرائح عالية الأداء، وتمكين الابتكار المالي، تؤثر هذه العوامل على إعادة تشكيل مشهد الاقتصاد الرقمي. في المستقبل، لن يكون تطوير الذكاء الاصطناعي مجرد سباق على قوة الحوسبة، بل سيكون سباقًا للتعاون بين قوة الحوسبة والابتكار في الخوارزمية. في هذا المسار الجديد، يقوم مبتكرون مثل DeepSeek بإعادة تعريف قواعد اللعبة بواسطة الذكاء.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 13
أعجبني
13
7
مشاركة
تعليق
0/400
ApeWithNoFear
· منذ 18 س
قوة الحوسبة تضخمت إلى أقصى الحدود.
شاهد النسخة الأصليةرد0
ParanoiaKing
· 08-05 09:24
6850 مليار معلمات؟ هل تلعب بجد؟
شاهد النسخة الأصليةرد0
LiquidityNinja
· 08-05 09:20
6850 مليار معلمة... لا بد من القول أن بطاقة N قد انتصرت بالفعل
شاهد النسخة الأصليةرد0
liquidation_surfer
· 08-05 09:18
حسناً، إنه مرة أخرى هو من يحرق بطاقة الرسوميات
شاهد النسخة الأصليةرد0
GasFeeCry
· 08-05 09:02
أصدرت شركات تصنيع الرقاقات ضحكة
شاهد النسخة الأصليةرد0
MidnightGenesis
· 08-05 08:57
تظهر المراقبة أن استهلاك موارد v3 قد ارتفع بشكل كبير، يبدو أن شركات تصنيع الرقائق ستربح جنونًا.
تحديث DeepSeek V3: نموذج بـ 6850 مليار معلمة يقود革新 الخوارزمية ويعيد تشكيل مشهد صناعة الذكاء الاصطناعي
تحديث نموذج DeepSeek V3: الخوارزمية革新引领AI新范式
مؤخرا، أصدرت DeepSeek تحديث النسخة V3 - DeepSeek-V3-0324، حيث وصلت معلمات النموذج إلى 6850 مليار، مع تحسينات ملحوظة في قدرات البرمجة وتصميم واجهة المستخدم وقدرات الاستدلال.
في مؤتمر GTC 2025 الذي انتهى مؤخرًا، أشاد التنفيذيون بـ DeepSeek، مشيرين في الوقت نفسه إلى أن السوق كان يعتقد سابقًا أن النموذج الفعال لـ DeepSeek سيقلل من الفهم حول الطلب على الرقائق، وهذا اعتقاد خاطئ، حيث إن الطلب على الحوسبة في المستقبل سيكون أكثر، وليس أقل.
يعتبر DeepSeek كمنتج يمثل突破ًا في الخوارزمية، وقد أثارت العلاقة بينه وبين موردي الشرائح تفكير الناس حول دور القوة الحاسوبية والخوارزمية في تطوير الصناعة.
تفاعل تطور القوة الحاسوبية والخوارزمية
في مجال الذكاء الاصطناعي، فإن زيادة قوة الحوسبة توفر أساساً لتشغيل خوارزميات أكثر تعقيداً، مما يمكّن النماذج من معالجة كميات أكبر من البيانات، وتعلم أنماط أكثر تعقيداً؛ بينما يمكن أن تؤدي تحسينات الخوارزمية إلى استخدام أكثر كفاءة لقوة الحوسبة، مما يزيد من كفاءة استخدام موارد الحوسبة.
علاقة التعايش بين القدرة الحاسوبية والخوارزمية تعيد تشكيل مشهد صناعة الذكاء الاصطناعي:
تنوع المسارات التقنية: تسعى بعض الشركات لبناء تجمعات هائلة من القدرة الحاسوبية، بينما تركز أخرى على تحسين كفاءة الخوارزمية، مما يؤدي إلى تشكيل مدارس تقنية مختلفة.
إعادة هيكلة سلسلة الصناعة: بعض الشركات أصبحت رائدة في قوة الذكاء الاصطناعي من خلال النظام البيئي، بينما قامت شركات خدمات السحابة بتخفيض عتبة النشر من خلال خدمات القوة المرنة.
تعديل تخصيص الموارد: تسعى الشركات إلى تحقيق التوازن بين الاستثمار في البنية التحتية للأجهزة وتطوير الخوارزمية الفعالة.
ظهور مجتمع المصدر المفتوح: نماذج المصدر المفتوح مثل DeepSeek و LLaMA تتيح مشاركة ابتكارات الخوارزمية ونتائج تحسين القدرة الحاسوبية، مما يسرع من تكرار وتوزيع التكنولوجيا.
الابتكارات التكنولوجية لـ DeepSeek
نجاح DeepSeek لا ينفصل عن ابتكاراته التكنولوجية. فيما يلي شرح مبسط لنقاط الابتكار الرئيسية الخاصة به:
تحسين بنية النموذج
تعتمد DeepSeek على بنية مركبة من Transformer و MOE (خليط من الخبراء) ، وتقدم آلية الانتباه الكامنة متعددة الرؤوس (MLA). تشبه هذه البنية فريقًا خارقًا، حيث يتحمل Transformer المهام الاعتيادية، بينما يعمل MOE كمجموعة من الخبراء، حيث يتمتع كل خبير بمجال تخصصه الخاص، وعند مواجهة مشكلة معينة يتولى الخبير الأكثر كفاءة التعامل معها، مما يزيد بشكل كبير من كفاءة النموذج ودقته. تتيح آلية MLA للنموذج الانتباه بشكل أكثر مرونة إلى التفاصيل الهامة المختلفة أثناء معالجة المعلومات، مما يعزز الأداء بشكل أكبر.
طرق التدريب الإبداعية
قدمت DeepSeek إطار عمل لتدريب دقيق مختلط FP8. يعمل هذا الإطار كموارد ذكية لتوزيع الموارد، حيث يختار ديناميكياً دقة الحساب المناسبة بناءً على احتياجات مراحل التدريب المختلفة. عند الحاجة إلى دقة عالية، يتم استخدام دقة أعلى لضمان دقة النموذج؛ وعندما يمكن قبول دقة أقل، يتم تقليل الدقة لتوفير موارد الحساب، وزيادة سرعة التدريب، وتقليل استهلاك الذاكرة.
تحسين كفاءة الاستدلال
في مرحلة الاستدلال، قدمت DeepSeek تقنية التنبؤ المتعدد الرموز (Multi-token Prediction, MTP). حيث تتوقع الطرق التقليدية رمزًا واحدًا فقط في كل خطوة، بينما تستطيع تقنية MTP التنبؤ بعدة رموز مرة واحدة، مما يسرع بشكل كبير من سرعة الاستدلال ويخفض من تكاليفه.
###突破 الخوارزمية التعلم المعزز
خوارزمية GRPO (التحسين المعاقب على المكافآت العامة) الجديدة من DeepSeek تعزز عملية تدريب النماذج. التعلم المعزز يشبه تزويد النموذج بمدرب، حيث يوجه النموذج لتعلم سلوكيات أفضل من خلال المكافآت والعقوبات. الخوارزمية الجديدة من DeepSeek أكثر كفاءة، حيث تضمن تحسين أداء النموذج مع تقليل الحسابات غير الضرورية، مما يحقق توازنًا بين الأداء والتكلفة.
تشكل هذه الابتكارات نظامًا تقنيًا كاملاً، مما يقلل من متطلبات قوة الحوسبة عبر سلسلة كاملة من التدريب إلى الاستدلال. يمكن الآن لبطاقات الرسوميات الاستهلاكية العادية تشغيل نماذج الذكاء الاصطناعي القوية، مما يقلل بشكل كبير من عتبة دخول تطبيقات الذكاء الاصطناعي، ويتيح المزيد من المطورين والشركات المشاركة في الابتكار في مجال الذكاء الاصطناعي.
تأثير على موردي الرقائق
يعتقد الكثيرون أن DeepSeek قد تجاوزت بعض الطبقات الوسيطة، مما أخرجها من الاعتماد على مزودين معينين. في الواقع، تقوم DeepSeek بتحسين الخوارزمية مباشرة من خلال طبقة PTX (Parallel Thread Execution). PTX هي لغة تمثيل وسيطة تقع بين التعليمات البرمجية عالية المستوى وتعليمات GPU الفعلية، من خلال التلاعب بهذه الطبقة، يمكن لـ DeepSeek تحقيق تحسينات أكثر دقة في الأداء.
إن تأثير ذلك على موردي الرقائق ذو شقين. من ناحية، أصبحت DeepSeek مرتبطة بالأجهزة والنظام البيئي بشكل أعمق، وقد يؤدي انخفاض العوائق أمام تطبيقات الذكاء الاصطناعي إلى توسيع حجم السوق الكلي؛ من ناحية أخرى، قد تؤدي تحسينات الخوارزمية لـ DeepSeek إلى تغيير هيكل الطلب في السوق على الشرائح عالية الأداء، حيث قد تتمكن بعض نماذج الذكاء الاصطناعي التي كانت تحتاج سابقًا إلى وحدات معالجة الرسومات العليا من العمل بكفاءة الآن على وحدات معالجة الرسومات متوسطة المدى أو حتى الاستهلاكية.
معنى صناعة الذكاء الاصطناعي
توفير تحسين الخوارزمية من DeepSeek مسار تقني للاختراق في صناعة الذكاء الاصطناعي. في ظل قيود رقائق عالية الجودة، خفف مفهوم "البرمجيات تعوض عن الأجهزة" من الاعتماد على الرقائق المستوردة الرائدة.
في المنبع، خففت الخوارزمية الفعالة من ضغط الطلب على قوة الحوسبة، مما يمكّن مزودي خدمات الحوسبة من تمديد دورة استخدام الأجهزة من خلال تحسين البرمجيات، وزيادة العائد على الاستثمار. في المصب، خفّض النموذج المفتوح المصدر المحسّن من عتبة تطوير تطبيقات الذكاء الاصطناعي. العديد من الشركات الصغيرة والمتوسطة يمكنها تطوير تطبيقات تنافسية استنادًا إلى نموذج DeepSeek دون الحاجة إلى موارد كبيرة من قوة الحوسبة، مما سيؤدي إلى ظهور المزيد من حلول الذكاء الاصطناعي في مجالات عمودية.
التأثير العميق على Web3+AI
بنية تحتية للذكاء الاصطناعي اللامركزي
تحسين الخوارزمية لـ DeepSeek يوفر دافعاً جديداً للبنية التحتية للذكاء الاصطناعي في Web3. الهندسة المعمارية المبتكرة، الخوارزميات الفعالة واحتياجات القدرة الحاسوبية المنخفضة تجعل الاستدلال القائم على الذكاء الاصطناعي اللامركزي ممكناً. هيكل MoE مناسب بطبيعته للنشر الموزع، حيث يمكن أن تحتوي العقد المختلفة على شبكات خبراء مختلفة، دون الحاجة إلى تخزين نموذج كامل في عقدة واحدة، مما يقلل بشكل كبير من متطلبات التخزين والحساب لعقدة واحدة، ويزيد من مرونة وكفاءة النموذج.
إطار تدريب FP8 يقلل بشكل أكبر من الحاجة إلى موارد حسابية عالية الجودة، مما يسمح لمزيد من الموارد الحسابية بالانضمام إلى شبكة العقد. هذا لا يقلل فقط من عتبة المشاركة في حسابات الذكاء الاصطناعي اللامركزية، بل يزيد أيضًا من قدرة وكفاءة الحساب في الشبكة بأكملها.
نظام متعدد الوكلاء
تحسين استراتيجيات التداول الذكي: من خلال تحليل بيانات السوق في الوقت الحقيقي، وتوقع تقلبات الأسعار على المدى القصير، وتنفيذ الصفقات على السلسلة، ومراقبة نتائج التداول، تساعد العمليات التعاونية للوكيل المستخدمين في تحقيق عوائد أعلى.
التنفيذ التلقائي للعقود الذكية: التشغيل التعاوني للوكلاء مثل مراقبة العقود الذكية، والتنفيذ، والإشراف على النتائج، لتحقيق أتمتة منطق الأعمال الأكثر تعقيدًا.
إدارة المحافظ الاستثمارية الشخصية: تساعد الذكاء الاصطناعي المستخدمين في العثور على أفضل فرص الرهن أو توفير السيولة في الوقت الفعلي بناءً على تفضيلات المخاطر وأهداف الاستثمار والحالة المالية للمستخدم.
تبحث DeepSeek عن اختراقات من خلال الابتكار في الخوارزمية تحت قيود قوة الحوسبة، مما يفتح مسار تطوير متميز لصناعة الذكاء الاصطناعي. خفض عتبة التطبيق، وتعزيز دمج Web3 والذكاء الاصطناعي، وتقليل الاعتماد على الشرائح عالية الأداء، وتمكين الابتكار المالي، تؤثر هذه العوامل على إعادة تشكيل مشهد الاقتصاد الرقمي. في المستقبل، لن يكون تطوير الذكاء الاصطناعي مجرد سباق على قوة الحوسبة، بل سيكون سباقًا للتعاون بين قوة الحوسبة والابتكار في الخوارزمية. في هذا المسار الجديد، يقوم مبتكرون مثل DeepSeek بإعادة تعريف قواعد اللعبة بواسطة الذكاء.