ثورة هندسة الذكاء الاصطناعي: من Transformer إلى معركة المئة نموذج
في الشهر الماضي، اندلعت "حرب حيوانات" في عالم الذكاء الاصطناعي. من جهة، هناك سلسلة نماذج Llama التي أطلقتها ميتا، والتي لاقت شعبية كبيرة بين المطورين بفضل خاصية المصدر المفتوح. ومن جهة أخرى، هناك نموذج كبير يسمى Falcon تم تطويره بواسطة معهد الابتكار التكنولوجي في الإمارات العربية المتحدة. تتناوب هذان النموذجان على تصدر قائمة LLM المفتوحة المصدر.
من المثير للاهتمام أن هدف الإمارات العربية المتحدة من المشاركة في مسابقة الذكاء الاصطناعي هو "إزاحة اللاعبين الرئيسيين". بعد ذلك بوقت قصير، تم اختيار وزير الذكاء الاصطناعي الإماراتي ضمن قائمة "أكثر 100 شخصية تأثيراً في مجال الذكاء الاصطناعي" التي نشرتها مجلة تايم.
اليوم، دخلت مجال الذكاء الاصطناعي مرحلة "تعدد الآراء". العديد من الدول والشركات تعمل على تطوير نماذج لغوية كبيرة خاصة بها. فقط في منطقة الخليج، هناك أكثر من لاعب واحد يشارك في هذا المجال. هذه الظاهرة أثارت مشاعر بعض العاملين في الصناعة، الذين يرون أن مجال التكنولوجيا الصلبة قد شهد أيضًا ظهور "معركة النماذج".
المحول يلتهم العالم
إن النمو المزدهر للنماذج الكبيرة الحالية يعود الفضل فيه إلى الورقة البحثية التي نُشرت في عام 2017 بعنوان "Attention Is All You Need". الخوارزمية التي اقترحتها هذه الورقة، والتي تُعرف باسم Transformer، أصبحت محفزًا لهذه الموجة الحالية من الذكاء الاصطناعي.
قبل ظهور Transformer، كان "تعليم الآلة القراءة" مشكلة أكاديمية معترف بها. كانت الشبكات العصبية المبكرة تواجه صعوبة في فهم سياق المعلومات. في عام 2014، ظهرت الشبكة العصبية المتكررة (RNN) والتي حلت هذه المشكلة إلى حد ما، ولكن خصائص حسابها التسلسلي حدت من قدرتها على معالجة البيانات الضخمة.
تحسن Transformer من خلال الابتكارات مثل الترميز الموضعي والحساب المتوازي، كفاءة التدريب وزاد من قدرته على فهم السياق. وهذا أدى إلى انتقال الذكاء الاصطناعي من البحث النظري إلى الممارسة الهندسية، مما مهد الطريق لعصر النماذج الكبيرة.
مع انتشار Transformers، تباطأ معدل الابتكار في الخوارزميات الأساسية، وأصبحت عناصر الهندسة مثل هندسة البيانات وحجم القوة الحاسوبية عوامل حاسمة في سباق الذكاء الاصطناعي. وقد أدى ذلك إلى أن أي شركة تمتلك قدرة تقنية معينة يمكنها محاولة تطوير نماذج كبيرة.
الخندق المبني على الزجاج
حالياً، أصبحت "معركة النماذج الكبرى" واقعاً. ووفقاً للتقارير، حتى يوليو من هذا العام، وصل عدد النماذج الكبرى في الصين إلى 130، متجاوزاً الولايات المتحدة التي لديها 114 نموذجاً. بالإضافة إلى الصين والولايات المتحدة، أطلقت دول مثل اليابان والهند وكوريا الجنوبية نماذج محلية كبرى.
ومع ذلك، فإن الدخول السهل لا يعني أن الجميع يستطيع أن يصبح عملاقًا في عصر الذكاء الاصطناعي. على سبيل المثال، في المنافسة بين Falcon و Llama، على الرغم من أن Falcon تتفوق في بعض التصنيفات، إلا أنه من الصعب القول إنها سببت تأثيرًا كبيرًا على Meta. بالنسبة لنماذج المصدر المفتوح الكبيرة، فإن مجتمع المطورين النشط هو القوة التنافسية الأساسية. تحتل Meta ميزة في هذا المجال بفضل جيناتها في وسائل التواصل الاجتماعي واستراتيجيتها المفتوحة المصدر.
علاوة على ذلك، لا يزال معظم النماذج الكبيرة تعاني من فجوة واضحة في الأداء مقارنةً بـ GPT-4. في اختبارات AgentBench الأخيرة، حصل GPT-4 على درجة 4.41، متفوقًا بفارق كبير، بينما حصلت Claude على 2.77، في حين أن معظم النماذج مفتوحة المصدر سجلت درجات قريبة من 1.
تأتي هذه الفجوة من الفرق العلمية عالية المستوى التي تمتلكها شركات الذكاء الاصطناعي الرائدة والخبرة المتراكمة على مر الزمن. لذلك، قد تكون القوة التنافسية الأساسية للنماذج الكبيرة في بناء النظام البيئي ( المسار المفتوح ) أو القدرة النقية على الاستدلال ( المسار المغلق ).
نقطة مرجعية للقيمة
على الرغم من أن حماس الذكاء الاصطناعي يشتد، إلا أن عدد الشركات القادرة على تحقيق أرباح من ذلك لا يزال قليلاً. أصبحت تكلفة القدرة الحاسوبية العالية عقبة كبيرة أمام تطور الصناعة. يُقدّر أن إنفاق الشركات التكنولوجية العالمية على بنية تحتية للنماذج الكبيرة قد يصل إلى 200 مليار دولار سنوياً، بينما الإيرادات الناتجة عن النماذج الكبيرة قد تصل إلى 75 مليار دولار كحد أقصى، مما يخلق فجوة كبيرة.
حتى الشركات الرائدة في الصناعة مثل مايكروسوفت وأدوبي تواجه تحديات في تسعير خدمات الذكاء الاصطناعي وضبط التكاليف. بالنسبة لمعظم النماذج الكبيرة ذات المعلمات الضخمة، لا تزال أهم سيناريوهات الاستخدام تتركز على وظائف الدردشة.
مع تزايد المنافسة المتجانسة وانتشار النماذج مفتوحة المصدر، قد تواجه نماذج الأعمال التي تعتمد فقط على تقديم خدمات النماذج الكبيرة ضغطًا أكبر في المستقبل. قد تكون القيمة الحقيقية لتقنية الذكاء الاصطناعي أكثر وضوحًا في سيناريوهات التطبيقات المحددة وقدرتها على حل المشكلات الفعلية.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
تسجيلات الإعجاب 9
أعجبني
9
5
مشاركة
تعليق
0/400
JustHereForAirdrops
· منذ 11 س
وصلت الأمور إلى الفوضى التامة.
شاهد النسخة الأصليةرد0
SerumSquirter
· منذ 11 س
حرب حرق الأموال، من لديه المال أكثر هو من يفوز
شاهد النسخة الأصليةرد0
WhaleStalker
· منذ 11 س
المستثمرين يتعاركون، مستثمر التجزئة صعب التحمل
شاهد النسخة الأصليةرد0
GasDevourer
· منذ 11 س
من يستطيع أن يتحمل تكلفة قوة الحوسبة بعد الآن؟
شاهد النسخة الأصليةرد0
ZenMiner
· منذ 11 س
لعبة حرق الأموال تجري بسلاسة، حقاً الأثرياء يعرفون كيف يلعبون.
تسارع المنافسة في نماذج الذكاء الاصطناعي الكبيرة: من Transformer إلى ثورة الهندسة في معركة المئات من النماذج
ثورة هندسة الذكاء الاصطناعي: من Transformer إلى معركة المئة نموذج
في الشهر الماضي، اندلعت "حرب حيوانات" في عالم الذكاء الاصطناعي. من جهة، هناك سلسلة نماذج Llama التي أطلقتها ميتا، والتي لاقت شعبية كبيرة بين المطورين بفضل خاصية المصدر المفتوح. ومن جهة أخرى، هناك نموذج كبير يسمى Falcon تم تطويره بواسطة معهد الابتكار التكنولوجي في الإمارات العربية المتحدة. تتناوب هذان النموذجان على تصدر قائمة LLM المفتوحة المصدر.
من المثير للاهتمام أن هدف الإمارات العربية المتحدة من المشاركة في مسابقة الذكاء الاصطناعي هو "إزاحة اللاعبين الرئيسيين". بعد ذلك بوقت قصير، تم اختيار وزير الذكاء الاصطناعي الإماراتي ضمن قائمة "أكثر 100 شخصية تأثيراً في مجال الذكاء الاصطناعي" التي نشرتها مجلة تايم.
اليوم، دخلت مجال الذكاء الاصطناعي مرحلة "تعدد الآراء". العديد من الدول والشركات تعمل على تطوير نماذج لغوية كبيرة خاصة بها. فقط في منطقة الخليج، هناك أكثر من لاعب واحد يشارك في هذا المجال. هذه الظاهرة أثارت مشاعر بعض العاملين في الصناعة، الذين يرون أن مجال التكنولوجيا الصلبة قد شهد أيضًا ظهور "معركة النماذج".
المحول يلتهم العالم
إن النمو المزدهر للنماذج الكبيرة الحالية يعود الفضل فيه إلى الورقة البحثية التي نُشرت في عام 2017 بعنوان "Attention Is All You Need". الخوارزمية التي اقترحتها هذه الورقة، والتي تُعرف باسم Transformer، أصبحت محفزًا لهذه الموجة الحالية من الذكاء الاصطناعي.
قبل ظهور Transformer، كان "تعليم الآلة القراءة" مشكلة أكاديمية معترف بها. كانت الشبكات العصبية المبكرة تواجه صعوبة في فهم سياق المعلومات. في عام 2014، ظهرت الشبكة العصبية المتكررة (RNN) والتي حلت هذه المشكلة إلى حد ما، ولكن خصائص حسابها التسلسلي حدت من قدرتها على معالجة البيانات الضخمة.
تحسن Transformer من خلال الابتكارات مثل الترميز الموضعي والحساب المتوازي، كفاءة التدريب وزاد من قدرته على فهم السياق. وهذا أدى إلى انتقال الذكاء الاصطناعي من البحث النظري إلى الممارسة الهندسية، مما مهد الطريق لعصر النماذج الكبيرة.
مع انتشار Transformers، تباطأ معدل الابتكار في الخوارزميات الأساسية، وأصبحت عناصر الهندسة مثل هندسة البيانات وحجم القوة الحاسوبية عوامل حاسمة في سباق الذكاء الاصطناعي. وقد أدى ذلك إلى أن أي شركة تمتلك قدرة تقنية معينة يمكنها محاولة تطوير نماذج كبيرة.
الخندق المبني على الزجاج
حالياً، أصبحت "معركة النماذج الكبرى" واقعاً. ووفقاً للتقارير، حتى يوليو من هذا العام، وصل عدد النماذج الكبرى في الصين إلى 130، متجاوزاً الولايات المتحدة التي لديها 114 نموذجاً. بالإضافة إلى الصين والولايات المتحدة، أطلقت دول مثل اليابان والهند وكوريا الجنوبية نماذج محلية كبرى.
ومع ذلك، فإن الدخول السهل لا يعني أن الجميع يستطيع أن يصبح عملاقًا في عصر الذكاء الاصطناعي. على سبيل المثال، في المنافسة بين Falcon و Llama، على الرغم من أن Falcon تتفوق في بعض التصنيفات، إلا أنه من الصعب القول إنها سببت تأثيرًا كبيرًا على Meta. بالنسبة لنماذج المصدر المفتوح الكبيرة، فإن مجتمع المطورين النشط هو القوة التنافسية الأساسية. تحتل Meta ميزة في هذا المجال بفضل جيناتها في وسائل التواصل الاجتماعي واستراتيجيتها المفتوحة المصدر.
علاوة على ذلك، لا يزال معظم النماذج الكبيرة تعاني من فجوة واضحة في الأداء مقارنةً بـ GPT-4. في اختبارات AgentBench الأخيرة، حصل GPT-4 على درجة 4.41، متفوقًا بفارق كبير، بينما حصلت Claude على 2.77، في حين أن معظم النماذج مفتوحة المصدر سجلت درجات قريبة من 1.
تأتي هذه الفجوة من الفرق العلمية عالية المستوى التي تمتلكها شركات الذكاء الاصطناعي الرائدة والخبرة المتراكمة على مر الزمن. لذلك، قد تكون القوة التنافسية الأساسية للنماذج الكبيرة في بناء النظام البيئي ( المسار المفتوح ) أو القدرة النقية على الاستدلال ( المسار المغلق ).
نقطة مرجعية للقيمة
على الرغم من أن حماس الذكاء الاصطناعي يشتد، إلا أن عدد الشركات القادرة على تحقيق أرباح من ذلك لا يزال قليلاً. أصبحت تكلفة القدرة الحاسوبية العالية عقبة كبيرة أمام تطور الصناعة. يُقدّر أن إنفاق الشركات التكنولوجية العالمية على بنية تحتية للنماذج الكبيرة قد يصل إلى 200 مليار دولار سنوياً، بينما الإيرادات الناتجة عن النماذج الكبيرة قد تصل إلى 75 مليار دولار كحد أقصى، مما يخلق فجوة كبيرة.
حتى الشركات الرائدة في الصناعة مثل مايكروسوفت وأدوبي تواجه تحديات في تسعير خدمات الذكاء الاصطناعي وضبط التكاليف. بالنسبة لمعظم النماذج الكبيرة ذات المعلمات الضخمة، لا تزال أهم سيناريوهات الاستخدام تتركز على وظائف الدردشة.
مع تزايد المنافسة المتجانسة وانتشار النماذج مفتوحة المصدر، قد تواجه نماذج الأعمال التي تعتمد فقط على تقديم خدمات النماذج الكبيرة ضغطًا أكبر في المستقبل. قد تكون القيمة الحقيقية لتقنية الذكاء الاصطناعي أكثر وضوحًا في سيناريوهات التطبيقات المحددة وقدرتها على حل المشكلات الفعلية.