أعلنت شركة OpenAI عن تحديث نوعي جديد يعيد تشكيل طريقة تفاعل المستخدمين مع وضع الصوت Voice Mode داخل منصة ChatGPT، سواء عبر متصفح الويب أو من خلال التطبيق. ويأتي هذا التطوير في إطار سعي الشركة إلى جعل المحادثات الصوتية أكثر انسيابية واندماجًا، من خلال تحويلها إلى تجربة بصرية متكاملة تتيح للمستخدم رؤية حركة الشفاه وتعابير الوجه والتفاعل البصري في الوقت الحقيقي، بشكل يحاكي المحادثات البشرية الطبيعية.
ويعتمد التحديث على نموذج محسن من الذكاء الاصطناعي قادر على توليد صور متحركة ثلاثية الأبعاد للوجه أثناء الحوار، مع تزامن دقيق بين الكلمات المنطوقة وحركات الفم، إضافة إلى تحسينات في جودة الصوت، وسرعة الاستجابة، وتقليل التأخير الذي كان يلاحظ في النسخ السابقة.
هذا التطوير المدمج بين الصوت والصورة يمهد لمرحلة جديدة في استخدامات ChatGPT، خصوصًا في ميادين التعليم عن بُعد، وخدمة الزبائن، والتدريب الصوتي، والعلاج عبر الحوار، والتواصل متعدد اللغات. كما يتيح للمستخدمين الشعور بدرجة أعلى من الحضور التفاعلي، مما يجعل الذكاء الاصطناعي يبدو أكثر قربًا وطبيعية في التفاعل.
وتشير OpenAI إلى أن التحديث سيصل تدريجيًا إلى جميع المستخدمين خلال الأيام المقبلة، مع التخطيط لإضافة خصائص تكاملية أخرى، مثل تخصيص مظهر المساعد المرئي، وتعديل نبرة الصوت، وإتاحة خيارات للصم أو ضعاف السمع عبر النصوص الفورية المرافقة.







0 التعليقات:
إرسال تعليق