Google a déclaré que son nouveau modèle de traduction parole à parole peut identifier et basculer entre plus de 70 langues.
Photo Credit: Google
Les développeurs peuvent accéder à Gemini 3.5 Live Translate dans l’aperçu public
Google a lancé mercredi son dernier modèle de traduction parole à parole appelé Gemini 3.5 Live Translate. Google prétend qu'il est conçu pour permettre des conversations multilingues plus naturelles. Selon l'entreprise, le nouveau modèle d'IA peut détecter plus de 70 langues et générer des discours traduits. Le résultat est censé préserver le ton, la cadence et l'intonation d'un locuteur tout en délivrant continuellement des traductions presque en temps réel. Gemini 3.5 Live Translate est en cours de déploiement sur Google Traduction, Google Meet, Google AI Studio et l'API Gemini Live pour les développeurs.
Dans un article de blog, Google a souligné que Gemini 3.5 Live Translate est la prochaine étape de ses efforts de traduction, qui ont commencé il y a près de deux décennies comme l'une des premières expériences d'apprentissage automatique de la société. La société affirme qu'il convient aux réunions multilingues, aux émissions en direct, aux leçons, aux interactions avec le service client et à l'interprétation en temps réel.
Gemini 3.5 Live Translate gère la traduction en direct avec un délai minimal, selon Google, et il est dit qu'il traite l'audio lorsqu'il est diffusé en temps réel, générant de l'audio traduit à quelques secondes derrière le haut-parleur d'origine. La société a déclaré qu'elle évite également les pauses qui sont souvent associées aux systèmes de traduction traditionnels par tour.
Selon Google, le nouveau modèle de traduction parole à parole peut identifier et basculer entre plus de 70 langues. Cela élimine également le besoin de configurer manuellement les paramètres linguistiques. Gemini 3.5 Live Translate est censé rester efficace dans les environnements bruyants et imprévisibles.
Des capacités de traduction améliorées sont également à venir sur Google Meet, a annoncé la société. Comme Live Translate, l'application prendra en charge la traduction dans plus de 70 langues, ce qui représente une augmentation significative par rapport à la limite précédente de cinq langues. En dehors de cela, le géant de la technologie apporte Gemini 3.5 Live Translate à l'application Google Traduction sur Android et iOS. Il sera disponible via Live Translate, et les paroles traduites pourront être écoutées à l'aide de n'importe quel casque compatible.
Sur Android, Google déploie un mode d'écoute qui permet de lire l'audio traduit directement via l'écouteur d'un smartphone.
En réponse aux préoccupations concernant les contenus générés par l'IA, la société a noté que tous les fichiers audio générés par Gemini 3.5 Live Translate sont intégrés à SynthID, la technologie de tatouage numérique de la société. Il est prétendu être intégré directement dans l'audio généré et est conçu pour aider à identifier le contenu généré par l'IA.
Les développeurs peuvent accéder à Gemini 3.5 Live Translate en version publique via l'API Gemini Live et Google AI Studio. Google a mis en avant les intégrations avec des plateformes telles qu'Agora, Fishjam, LiveKit, Pipecat et Vision Agents, afin de faciliter la création et le déploiement d'applications de traduction vocale. Le modèle d'IA est déployé à l'échelle mondiale dans les produits Google pris en charge dès aujourd'hui.
Publicité
Publicité
Samsung Galaxy S25 Gets New Galaxy AI Features From Galaxy S26 With New One UI 8.5 Update
Ubisoft Shuts Down 2 More Studios, Lays Off Up to 380 Employees in Latest Round of Cost Cuts