جوجل تطلق ميزة الترجمة الحية الفورية في Gemini 3.5.. وداعا لعوائق اللغة

جوجل تطلق ميزة الترجمة الحية الفورية في Gemini 3.5.. وداعا لعوائق اللغة

أطلقت جوجل يوم الأربعاء أحدث نموذج ترجمة كلامية لها، Gemini 3.5 Live Translate، تزعم جوجل أن هذه التقنية مصممة لتمكين محادثات متعددة اللغات أكثر سلاسة، ووفقًا للشركة، يستطيع نموذج الذكاء الاصطناعي الجديد اكتشاف أكثر من 70 لغة وتوليد ترجمة صوتية، وتزعم الشركة أن النتيجة تحافظ على نبرة المتحدث وسرعته وتنغيمه، مع تقديم ترجمات شبه فورية باستمرار، يتم طرح Gemini 3.5 Live Translate الآن عبر Google Translate وGoogle Meet وGoogle AI Studio وواجهة برمجة تطبيقات Gemini Live للمطورين.

 

تعالج Gemini 3.5 Live Translate الصوت أثناء بثه في الوقت الفعلي

في منشور على مدونتها، أكدت جوجل أن Gemini 3.5 Live Translate هي الخطوة التالية في جهودها في مجال الترجمة، والتي بدأت منذ ما يقرب من عقدين من الزمن كإحدى أوائل تجارب الشركة في مجال التعلم الآلي، وتزعم الشركة أنها مناسبة للاجتماعات متعددة اللغات، والبث المباشر، والدروس، وتفاعلات دعم العملاء، والترجمة الفورية.

وتُعالج خدمة الترجمة الفورية Gemini 3.5 Live Translate الترجمة الفورية بأقل تأخير ممكن، وفقًا لشركة جوجل، حيث تُعالج الصوت أثناء بثه في الوقت الفعلي، مُنتجةً ترجمة صوتية متأخرة بضع ثوانٍ عن المتحدث الأصلي، وأكدت الشركة أنها تتجنب أيضًا فترات التوقف التي غالبًا ما تُصاحب أنظمة الترجمة التقليدية القائمة على الأدوار.

ووفقًا لجوجل، يُمكن لنموذج الترجمة الجديد من كلام إلى كلام تحديد أكثر من 70 لغة والتبديل بينها، كما أنه يُغني عن الحاجة إلى ضبط إعدادات اللغة يدويًا، ويُقال إن Gemini 3.5 Live Translate تظل فعّالة حتى في البيئات الصاخبة وغير المتوقعة، وأعلنت الشركة أيضًا عن إضافة إمكانيات ترجمة مُحسّنة إلى Google Meet، وكما هو الحال في Live Translate، سيدعم التطبيق الترجمة بأكثر من 70 لغة، وهو ما يُمثل زيادة كبيرة عن الحد السابق الذي كان يقتصر على خمس لغات، بالإضافة إلى ذلك، تُضيف جوجل خدمة Gemini 3.5 Live Translate إلى تطبيق Google Translate على نظامي Android وiOS، ستتوفر هذه الميزة عبر خدمة الترجمة الفورية، ويمكن سماع الصوت المترجم عبر أى سماعات رأس متوافقة.

وفي معرض ردها على المخاوف المتعلقة بالمحتوى المُنشأ بواسطة الذكاء الاصطناعي، أشارت الشركة إلى أن جميع الأصوات التي يُنتجها Gemini 3.5 Live Translate مُدمجة بتقنية SynthID، وهي تقنية العلامة المائية الخاصة بالشركة، يُزعم أنها مُدمجة مباشرةً في الصوت المُنشأ، ومُصممة للمساعدة في تحديد المحتوى المُنشأ بواسطة الذكاء الاصطناعي.

ويمكن للمطورين الوصول إلى Gemini 3.5 Live Translate في معاينة عامة عبر Gemini Live API وGoogle AI Studio، سلطت جوجل الضوء على التكامل مع منصات مثل Agora وFishjam وLiveKit وPipecat وVision Agents، لمساعدتهم على بناء تطبيقات الترجمة الصوتية ونشرها بسهولة أكبر، يتم طرح نموذج الذكاء الاصطناعي عالميًا عبر منتجات جوجل المدعومة بدءًا من اليوم.

نقلاً عن موقع: اليوم السابع

محرر الأخبار العاجلة في موقع خليج فايف.