أحدث مجموعة AI من ميتا تجعل ترجمة الكلام أكثر سلاسة وتعبيرًا
في شهر أغسطس الماضي، كشفت شركة ميتا النقاب عن نموذج الترجمة متعدد الوسائط المعتمد على الذكاء الاصطناعي، SeamlessM4T، والذي يدعم ما يقرب من 100 لغة للنص و36 لغة للكلام. من خلال بنية "v2" المحدثة، يتوسع عملاق التكنولوجيا الآن في هذه الأداة لجعل ترجمات المحادثة أكثر عفوية وتعبيرية - وهذا الأخير هو المفتاح المفقود لمحادثة حقيقية عبر اللغات.
ميزات ميتا الجديدة
أول ميزتين جديدتين هي "SeamlessExpressive" والتي، كما يمكنك معرفة ذلك من الاسم، تنقل تعبيراتك إلى كلامك المترجم. يتضمن ذلك درجة الصوت ومستوى الصوت والنبرة العاطفية (الإثارة أو الحزن أو الهمسات) ومعدل الكلام والتوقف المؤقت. وبالنظر إلى أن الخطابات المترجمة كانت تبدو دائمًا آلية حتى الآن، فمن المحتمل أن يغير هذا الإنجاز قواعد اللعبة - سواء في حياتنا اليومية أو في إنتاج المحتوى أيضًا. تشمل اللغات المدعومة الإنجليزية والإسبانية والألمانية والفرنسية والإيطالية والصينية، على الرغم من أن الصفحة التجريبية تفتقد الإيطالية والصينية في وقت كتابة هذه المقالة.
الميزة الثانية هي "SeamlessStreaming"، والتي تبدأ في ترجمة الكلام بينما لا يزال المتحدث يتحدث، مما يسمح للآخرين بسماع الترجمة بشكل أسرع. لا يزال هناك زمن وصول قصير يقل قليلاً عن ثانيتين، ولكن على الأقل لن تضطر إلى الانتظار حتى ينهي شخص ما الجملة. وفقًا لشركة ميتا Meta، فإن التحدي هنا هو أن اللغات المختلفة لها هياكل جمل مختلفة، لذلك كان عليها تطوير خوارزمية مخصصة لدراسة الإدخال الصوتي الجزئي، من أجل تحديد ما إذا كان هناك سياق كافٍ لبدء إنتاج مخرجات مترجمة، أو ما إذا كنت ستستمر في الاستماع. .
يبدو أن أحدث تطورات ميتا Meta في مجموعة "Seamless Communication" مثيرة للإعجاب - أكثر من أدوات الترجمة الفورية على الأجهزة المحمولة التي تقدمها شركات مثل Google وSamsung. لا توجد معلومات حول متى سيتمكن الجمهور من الاستفادة من هذه الميزات الجديدة، ولكن يمكنني بالفعل أن أتخيل أن Meta ستضعها في نظاراتها الذكية يومًا ما، مما يجعلها أكثر عملية من أي وقت مضى.