ذكاء اصطناعي من غوغل يبث الحياة في الصور
أماط باحثون من غوغل اللثام عن نموذج ذكاء اصطناعي يسمح بإنشاء مقاطع فيديو واقعية لأشخاص يتحركون ويتحدثون فقط باستخدام صورة ثابتة لهم.
“فلوغر” – ذكاء اصطناعي من غوغل نموذج جديد
والنموذج الذي جاء تحت اسم “فلوغر” . يعتمد على تجميع اللقطات الواقعية مع بعضها في مقطع واحد من خلال نماذج التعلم الآلي.
وقال باحثو غوغل ان النموذج يمكنه توليد مقاطع فيديو واقعية لأشخاص يتحدثون ويتحركون أيضا. كما ويظهرون التعبيرات الجسدية والإيماءات من صورة ثابتة واحدة.
ووفقًا للورقة البحثية التي نشرها الباحثون في قطاع غوغل للأبحاث. يمكن لنموذج الذكاء الاصطناعي الجديد الاعتماد على مدخلات تتضمن صورة لشخص ما مع مقطع صوتي لإنتاج مقطع فيديو يظهر الشخص وهو يتحدث بالصوت نفسه. مع تعبيرات الوجه وإيماءات الرأس واليد الملائمة أيضا.
ومع أن مقاطع الفيديو التي نشرها باحثو غوغل ليست مثالية وبها بعض الأخطاء، وقصيرة نسبيًا ولها خلفية ثابتة، ولا يتحرك الأفراد فيها في بيئة ثلاثية الأبعاد، لكنها تمثل طفرة كبيرة في تحريك الصور الثابتة.
وبتطوير الأداة وتدريبها تم توسيع الميزة لتشمل إنتاج مقاطع الفيديو من خلال قراءة مجموعة من البيانات. وبإمكان تقنيةVLOGGER إنشاء مقاطع فيديو لأشخاص من جنسيات وأعمار مختلفة، كذلك بمواصفات وملابس وأوضاع وبيئات متنوعة أيضا.
نماذج الانتشار Diffusion Models
واعتمد الباحثون على نوع جديد من نماذج الذكاء الاصطناعي تسمى نماذج الانتشار Diffusion Models. التي أظهرت أداءً مميزًا في توليد الصور من النصوص. وقد وسع فريق الباحثين استخدامها ليشمل توليد مقاطع الفيديو مع التدريب على مجموعة ضخمة من البيانات، شملت ما يزيد على 800 ألف هوية مختلفة و 2200 ساعة من مقاطع الفيديو، مما أتاح لنموذج VLOGGER تعلم إنشاء مقاطع فيديو لأشخاص من أعراق وأعمار وملابس وأوضاع وبيئات متنوعة دون تحيز.
ويمكن استخدام نموذج “فلوغر” في العديد من الاستخدامات أيضا. ومنها دبلجة مقاطع الفيديو تلقائيًا عبر تبديل المسار الصوتي، وملء الإطارات المفقودة في مقاطع الفيديو أيضا. كما وإنشاء صور رمزية واقعية للألعاب والواقع الافتراضي، وإنشاء ربوتوتات دردشة يمكنها التفاعل مع المستخدمين على نحو أفضل.
كما وتفتح تلك التقنية الباب لعدد كبير من التطبيقات المحتملة لها، لكنها في الوقت نفسه تثير المخاوف بشأن إساءة استخدامها للتضليل وإنتاج مقاطع فيديو على نحو يشبه آليات التزييف العميق.
ميدل إيست أون لاين