علوم وتكنولوجيا

‘أوبن آي’ تعيد هيكلة التفاعل الصوتي في ‘تشات جي بي تي’ جذريا

في خطوة استراتيجية تهدف إلى تعزيز موقعها في سباق المساعدات الذكية المتطورة، أطلقت شركة “أوبن آي” (OpenAI) تحديثاً جوهرياً لواجهة التفاعل الصوتي في تطبيقها الشهير “تشات جي بي تي” (ChatGPT). وينهي هذا التحديث عهد “الواجهة الصوتية المنفصلة”، مستبدلاً إياها بنظام مدمج يوحّد النصوص، والصوت، والعناصر المرئية في شاشة واحدة، مما يعكس تحولاً كبيراً في فلسفة تصميم تجربة المستخدم لدى الشركة المدعومة من مايكروسوفت.

ويأتي هذا التغيير في وقت تتصاعد فيه المنافسة بين عمالقة التكنولوجيا مثل غوغل وآبل لتقديم مساعدات ذكية قادرة على إجراء محادثات طبيعية وسلسة، تتجاوز مجرد الأوامر الصوتية البسيطة لتصل إلى تفاعل متعدد الوسائط يحاكي التواصل البشري.

نهاية “الشاشة الزرقاء”: تحول نحو الاندماج الكامل

بموجب التحديث الجديد، تخلت “أوبن آي” عن واجهة المستخدم السابقة التي كانت تخصص شاشة مستقلة تماماً للتفاعل الصوتي. في النظام القديم، كان المستخدم عند تفعيل المحادثة الصوتية ينتقل إلى شاشة سوداء تتوسطها دائرة زرقاء متحركة تمثل حالة الاستماع والمعالجة، مع وجود أزرار محدودة للتحكم.

وعلى الرغم من أن تلك الواجهة كانت توفر تركيزاً سمعياً كاملاً، إلا أنها كانت تفصل المستخدم عن سياق المحادثة النصي. لم يعد بإمكان المستخدم رؤية ما “يفكر” فيه النموذج أو قراءة الردود في الوقت الفعلي، وكان التحقق من معلومة مكتوبة يتطلب الخروج كلياً من وضع الصوت، مما كان يتسبب في انقطاع تدفق الحوار.

أما النظام الجديد، فيسمح للمستخدم بالتحدث مباشرة داخل نافذة الدردشة التقليدية. وبينما يتحدث المستخدم، يقوم النظام بكتابة الردود نصياً بالتزامن مع نطقها صوتياً. هذا التغيير التقني يعني إزالة الحواجز بين “الدردشة الكتابية” و”الدردشة الصوتية”، ليصبحا جزءاً واحداً متكاملاً من واجهة الاستخدام الرئيسية.

تجربة “متعددة الوسائط” في الوقت الفعلي

ويرى محللون تقنيون أن القيمة المضافة الحقيقية لهذا التحديث لا تكمن فقط في الشكل الجمالي، بل في الوظائف العملية التي يتيحها دمج الصوت مع الشاشة، حيث يعالج التحديث ثغرات جوهرية في قابلية الاستخدام كانت تواجه المستخدمين.

فمن خلال الواجهة المدمجة، بات بإمكان المستخدم الآن تجاوز حدود التفاعل السمعي المجرد، ليصبح الاستعراض الفوري للمرئيات جزءاً أصيلاً من التجربة؛ إذ إنه في حال قام النموذج بتوليد صورة، أو عرض خريطة، أو إنشاء رسم بياني كجزء من الإجابة، يمكن للمستخدم رؤية هذه العناصر ومناقشتها صوتياً في اللحظة ذاتها دون الحاجة لقطع الاتصال أو تبديل النوافذ. وعلاوة على ذلك، تضمن الواجهة الجديدة الحفاظ على سياق المحادثة بشكل فعال، حيث تتيح للمستخدم العودة لقراءة الرسائل السابقة ومراجعتها بينما يستمر الحوار الصوتي في الخلفية، وهي ميزة كانت مستحيلة تقنياً في وضع الشاشة الكاملة السابق.

كما يعزز هذا الدمج دقة التواصل عبر خاصية تزامن القراءة والاستماع، حيث يساعد ظهور النص بالتوازي مع الصوت المستخدمين على استيعاب المصطلحات المعقدة أو الأسماء الأجنبية التي قد يصعب التقاطها بدقة عبر السمع فقط، مما يقلل من احتمالات سوء الفهم ويرفع كفاءة تبادل المعلومات.

 

ميدل إيست اون لاين

مقالات ذات صلة

زر الذهاب إلى الأعلى