يمكن أن يكون ل ChatGPT التالي وجه وصوت

المرحلة التالية في تطور روبوتات الدردشة يمكن أن تمنحها وجها إنسانيا

ربما يكون ChatGPT قد أخذ الإنترنت عن طريق العاصفة ، لكنه لا يزال محدودا للغاية في كيفية تفاعلك معه. لكن روبوتات المحادثة في المستقبل قد لا تكون محدودة للغاية. في الواقع ، قد يكون لديهم صور رمزية تشبه الإنسان يمكنك إجراء محادثة منطوقة معها ، بدلا من إجبارهم على كتابة الرسائل وقراءتها.

لقد تحدثت إلى إحدى الشركات، وهي شركة D-ID الإسرائيلية، حول هذا الاحتمال في المؤتمر العالمي للجوال في برشلونة. D-ID(يفتح في علامة تبويب جديدة) يدور حول إنشاء أشخاص رقميين ، من نوع ما ، وهذا يعني الآن إضافة اتصال بشري أكثر إلى روبوتات الدردشة الذكاء الاصطناعي - وهو أمر تأمل في تحقيقه مع إطلاق واجهة برمجة التطبيقات الجديدة الخاصة بها.

توفر واجهة برمجة التطبيقات هذه إمكانات بث في الوقت الفعلي ، مما يتيح لك التحدث إلى chatbot كما تفعل مع إنسان عادي. يمكن لروبوت الدردشة نفسه استخدام تقنية تحويل النص إلى فيديو وإعطاء الانطباع بأن الصورة الرمزية الرقمية الخاصة به تتحدث بالفعل بصوت بشري. بالطبع يمكنك اختيار الكتابة بدلا من ذلك ، إذا وجدت أنه أفضل من التحدث إلى آلة.

كونها واجهة برمجة تطبيقات ، فهذا يعني أنه يمكن دمج نظام D-ID في التطبيقات والخدمات الأخرى. الفكرة العامة هي أن تقوم الشركات ببناء وتقديم مساعدين افتراضيين يمكن للأشخاص التواصل معهم على مستوى شخصي أكثر - وهنا يأتي دور جانب الوجه.

وفقا للرئيس التنفيذي لشركة D-ID والمؤسس المشارك جيل بيري ، فإن البشر ليسوا مجهزين للمحادثات التي تعتمد فقط على النص أو الصوت. بدلا من ذلك ، فإن وجود وجه بشري (أو على الأقل تمثيله) يجعل كل شيء أكثر جاذبية وطبيعية - وبلغات متعددة للإقلاع.

بالإضافة إلى ذلك ، من منظور الأعمال ، فإن وجود شخص الذكاء الاصطناعي يقوم بمجموعة من الأشياء نيابة عنك يوفر لك تكلفة توظيف أشخاص فعليين. سواء كان ذلك التحدث مع العملاء أو تدريب الموظفين أو أي شيء آخر يمكن للذكاء الاصطناعي التعامل معه في حالته الحالية.

في الوقت الحالي ، يميل الناس إلى أن يكونوا متشككين وحذرين بشأن الذكاء الاصطناعي ، واقترح بيري أن هذه الطبيعة المجهولة قد تكون جزءا من السبب. يمكن أن تساعد إضافة وجه بشري الأشخاص على الشعور براحة أكبر في التحدث مع روبوت الدردشة ، حتى لو كانوا يعرفون أنه لا يوجد إنسان في الطرف الآخر من المكالمة.

رأيت عرضا توضيحيا للعديد من روبوتات الدردشة D-ID في MWC ، بما في ذلك إمكانات البث المتكاملة الجديدة. كان من المثير للاهتمام بالتأكيد رؤية الأنواع المختلفة من الصور الرمزية أثناء العمل ، ولكن حتى أكثرها تقدما كان لها تأثير وادي غريب عليهم.

كان هذا صحيحا بشكل خاص بالنسبة للرسوم المتحركة الناطقة. لم يكن كل شيء متزامنا تماما ، وفي بعض الأحيان بدا الأمر أشبه برفرفة فم عشوائية أكثر من صورة رمزية تحاول نطق الصوت - وهو ما لا يفعله في الواقع.

لاحظت أيضا بعض التأخيرات الواضحة في التعرف على الكلام والكتابة حيث كان الروبوت يتفاعل مع الأشخاص. لكن هذا لا يغير حقيقة أنه يمكنك التحدث إلى الروبوت ، وجعله يفهم ما تقوله ويقدم ردا دون الحاجة إلى كتابة أو قراءة شيء واحد.

السؤال الوحيد هو ما إذا كان هذا النوع من التجربة سيكون متاحا للجمهور ومتى. هدف D-ID هو تقديم واجهة برمجة التطبيقات الخاصة به للشركات ومستخدمي المؤسسات. ولكن ، كما رأينا مع انفجار شعبية ChatGPT الأخير ، هناك فرصة جيدة لرؤية هذا النوع من التكنولوجيا يظهر في ساحة عامة أكثر. لا سيما بالنظر إلى عدد الشركات التي تركز على الذكاء الاصطناعي والتي بدت على الأرض في MWC ، وعدد منافسي ChatGPT الذين ظهروا في الأسابيع الأخيرة.

Al-Ghazali-Tech - الغزالي تقنى

يمكن أن يكون ل ChatGPT التالي وجه وصوت

Hussein Ghazzaly

Default