إنجازات تقنية توليد الفيديو بالذكاء الاصطناعي تفتح آفاق جديدة
من أبرز التطورات الأخيرة في مجال الذكاء الاصطناعي هي突破 تقنية إنشاء الفيديو متعدد الوسائط. لقد تطورت هذه التقنية من إنشاء فيديوهات من نصوص فردية إلى تقنية إنشاء شاملة تجمع بين النصوص والصور والصوت.
تتجلى هذه الاختراقات التكنولوجية في عدة جوانب:
الإطار المفتوح المصدر EX-4D الذي طورته شركة معينة يمكنه تحويل الفيديو الأحادي إلى محتوى 4D بزاوية عرض حرة، وقد بلغت نسبة قبول المستخدمين 70.7%. وهذا يعني أن الذكاء الاصطناعي يمكنه توليد تأثيرات مشاهدة من أي زاوية بشكل تلقائي، وهو ما كان يتطلب في السابق فريقًا محترفًا في النمذجة ثلاثية الأبعاد.
تدعي ميزة "Huixiang" التي أطلقتها منصة معينة أنه يمكنها أن تولد فيديو بجودة "سينمائية" مدته 10 ثوانٍ من صورة واحدة. ومع ذلك، لا يزال يتعين التحقق من صحة هذا الادعاء.
تقنية Veo من إحدى المؤسسات البحثية قادرة على توليد فيديو بدقة 4K وصوت بيئي في نفس الوقت. تكمن أهمية هذه التقنية في تحقيق المطابقة الحقيقية على المستوى الدلالي بين الفيديو والصوت، مما يتغلب على التحديات المتعلقة بتزامن الصوت والصورة في المشاهد المعقدة.
تقنية ContentV لمنصة الفيديو القصير لديها 80 مليار معلمة، يمكنها إنتاج فيديو بدقة 1080p في 2.3 ثانية، بتكلفة 3.67 يوان/5 ثوان. على الرغم من التحكم الجيد في التكلفة، إلا أن هناك مجال لتحسين جودة الإنتاج في المشاهد المعقدة.
تتمتع هذه الاختراقات بأهمية كبيرة من حيث القيمة التكنولوجية، وتقليل التكاليف، وتأثير التطبيقات.
القيمة التقنية: تعقيد توليد الفيديو متعدد الأنماط هو أسي. من خلال التفكيك المعياري والتعاون بين النماذج الكبيرة، تم تحقيق عملية توليد فعالة.
خفض التكاليف: تم تحسين بنية الاستدلال، بما في ذلك استراتيجيات التوليد الهرمي، وآليات إعادة استخدام التخزين المؤقت، وتخصيص الموارد الديناميكي، مما أدى إلى خفض كبير في تكاليف التوليد.
تأثير التطبيقات: ستقوم تقنيات الذكاء الاصطناعي بتقليص العمليات التقليدية في إنتاج الفيديو ذات الأصول الثقيلة إلى إدخال كلمات بسيطة والانتظار لبضع دقائق، مما قد يؤدي إلى إعادة تشكيل اقتصاد المبدعين.
لقد أثرت هذه التغييرات أيضًا على مجال Web3 AI:
تغير هيكل طلب قوة الحوسبة، مما خلق فرصًا جديدة لقوة الحوسبة الموزعة غير المستغلة ومجموعة متنوعة من نماذج الضبط الدقيق، والخوارزميات، ومنصات الاستدلال.
تعزيز متطلبات وضع العلامات على البيانات قد يحفز المتخصصين على تقديم مواد بيانات عالية الجودة، مما يعزز قدرة توليد الفيديو بالذكاء الاصطناعي من خلال آلية التحفيز Web3.
تتجه تقنية الذكاء الاصطناعي نحو التعاون القائم على الوحدات، مما يخلق طلبًا جديدًا على المنصات اللامركزية، ومن المتوقع أن يدفع نحو دمج سيناريوهات الذكاء الاصطناعي في Web3 و Web2.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 21
أعجبني
21
6
مشاركة
تعليق
0/400
SquidTeacher
· 07-10 09:48
لا بد من رؤية كيف سيكون التأثير الفعلي.
شاهد النسخة الأصليةرد0
NeverPresent
· 07-07 14:21
أشعر أنني سأفقد وظيفتي مرة أخرى ...
شاهد النسخة الأصليةرد0
HappyToBeDumped
· 07-07 14:19
لا أفضل من شراء عملة لكسب المال
شاهد النسخة الأصليةرد0
AirdropATM
· 07-07 14:17
أقول زاوية حرة منذ زمن بعيد، لن أحتاج إلى دفع المال لاستئجار مصور بعد الآن.
شاهد النسخة الأصليةرد0
0xDreamChaser
· 07-07 14:14
هذه الفرصة يجب أن نغتنمها
شاهد النسخة الأصليةرد0
PessimisticOracle
· 07-07 13:52
الجميع يبالغ في الثناء لكن نسبة 70% من القبول لا تزال منخفضة
تقنية توليد الفيديو بالذكاء الاصطناعي تحقق突破ًا يعيد تشكيل اقتصاد الإبداع وفرص Web3
إنجازات تقنية توليد الفيديو بالذكاء الاصطناعي تفتح آفاق جديدة
من أبرز التطورات الأخيرة في مجال الذكاء الاصطناعي هي突破 تقنية إنشاء الفيديو متعدد الوسائط. لقد تطورت هذه التقنية من إنشاء فيديوهات من نصوص فردية إلى تقنية إنشاء شاملة تجمع بين النصوص والصور والصوت.
تتجلى هذه الاختراقات التكنولوجية في عدة جوانب:
الإطار المفتوح المصدر EX-4D الذي طورته شركة معينة يمكنه تحويل الفيديو الأحادي إلى محتوى 4D بزاوية عرض حرة، وقد بلغت نسبة قبول المستخدمين 70.7%. وهذا يعني أن الذكاء الاصطناعي يمكنه توليد تأثيرات مشاهدة من أي زاوية بشكل تلقائي، وهو ما كان يتطلب في السابق فريقًا محترفًا في النمذجة ثلاثية الأبعاد.
تدعي ميزة "Huixiang" التي أطلقتها منصة معينة أنه يمكنها أن تولد فيديو بجودة "سينمائية" مدته 10 ثوانٍ من صورة واحدة. ومع ذلك، لا يزال يتعين التحقق من صحة هذا الادعاء.
تقنية Veo من إحدى المؤسسات البحثية قادرة على توليد فيديو بدقة 4K وصوت بيئي في نفس الوقت. تكمن أهمية هذه التقنية في تحقيق المطابقة الحقيقية على المستوى الدلالي بين الفيديو والصوت، مما يتغلب على التحديات المتعلقة بتزامن الصوت والصورة في المشاهد المعقدة.
تقنية ContentV لمنصة الفيديو القصير لديها 80 مليار معلمة، يمكنها إنتاج فيديو بدقة 1080p في 2.3 ثانية، بتكلفة 3.67 يوان/5 ثوان. على الرغم من التحكم الجيد في التكلفة، إلا أن هناك مجال لتحسين جودة الإنتاج في المشاهد المعقدة.
تتمتع هذه الاختراقات بأهمية كبيرة من حيث القيمة التكنولوجية، وتقليل التكاليف، وتأثير التطبيقات.
القيمة التقنية: تعقيد توليد الفيديو متعدد الأنماط هو أسي. من خلال التفكيك المعياري والتعاون بين النماذج الكبيرة، تم تحقيق عملية توليد فعالة.
خفض التكاليف: تم تحسين بنية الاستدلال، بما في ذلك استراتيجيات التوليد الهرمي، وآليات إعادة استخدام التخزين المؤقت، وتخصيص الموارد الديناميكي، مما أدى إلى خفض كبير في تكاليف التوليد.
تأثير التطبيقات: ستقوم تقنيات الذكاء الاصطناعي بتقليص العمليات التقليدية في إنتاج الفيديو ذات الأصول الثقيلة إلى إدخال كلمات بسيطة والانتظار لبضع دقائق، مما قد يؤدي إلى إعادة تشكيل اقتصاد المبدعين.
لقد أثرت هذه التغييرات أيضًا على مجال Web3 AI:
تغير هيكل طلب قوة الحوسبة، مما خلق فرصًا جديدة لقوة الحوسبة الموزعة غير المستغلة ومجموعة متنوعة من نماذج الضبط الدقيق، والخوارزميات، ومنصات الاستدلال.
تعزيز متطلبات وضع العلامات على البيانات قد يحفز المتخصصين على تقديم مواد بيانات عالية الجودة، مما يعزز قدرة توليد الفيديو بالذكاء الاصطناعي من خلال آلية التحفيز Web3.
تتجه تقنية الذكاء الاصطناعي نحو التعاون القائم على الوحدات، مما يخلق طلبًا جديدًا على المنصات اللامركزية، ومن المتوقع أن يدفع نحو دمج سيناريوهات الذكاء الاصطناعي في Web3 و Web2.