Gemini 3.5 Live Translate fait ses débuts avec la traduction vocale en temps réel

Google a déclaré que son nouveau modèle de traduction parole à parole peut identifier et basculer entre plus de 70 langues.

Gemini 3.5 Live Translate fait ses débuts avec la traduction vocale en temps réel

Photo Credit: Google

Les développeurs peuvent accéder à Gemini 3.5 Live Translate dans l’aperçu public

Points forts
  • Le modèle IA de Google prend en charge plus de 70 langues
  • L’audio de Gemini 3.5 Live Translate intègre SynthID
  • Déploiement dès aujourd’hui sur les produits Google compatibles
Publicité

Google a lancé mercredi son dernier modèle de traduction parole à parole appelé Gemini 3.5 Live Translate. Google prétend qu'il est conçu pour permettre des conversations multilingues plus naturelles. Selon l'entreprise, le nouveau modèle d'IA peut détecter plus de 70 langues et générer des discours traduits. Le résultat est censé préserver le ton, la cadence et l'intonation d'un locuteur tout en délivrant continuellement des traductions presque en temps réel. Gemini 3.5 Live Translate est en cours de déploiement sur Google Traduction, Google Meet, Google AI Studio et l'API Gemini Live pour les développeurs.

Gemini 3.5 Live Translate traite l'audio tel qu'il est diffusé en temps réel


Dans un article de blog, Google a souligné que Gemini 3.5 Live Translate est la prochaine étape de ses efforts de traduction, qui ont commencé il y a près de deux décennies comme l'une des premières expériences d'apprentissage automatique de la société. La société affirme qu'il convient aux réunions multilingues, aux émissions en direct, aux leçons, aux interactions avec le service client et à l'interprétation en temps réel.

Gemini 3.5 Live Translate gère la traduction en direct avec un délai minimal, selon Google, et il est dit qu'il traite l'audio lorsqu'il est diffusé en temps réel, générant de l'audio traduit à quelques secondes derrière le haut-parleur d'origine. La société a déclaré qu'elle évite également les pauses qui sont souvent associées aux systèmes de traduction traditionnels par tour.

Selon Google, le nouveau modèle de traduction parole à parole peut identifier et basculer entre plus de 70 langues. Cela élimine également le besoin de configurer manuellement les paramètres linguistiques. Gemini 3.5 Live Translate est censé rester efficace dans les environnements bruyants et imprévisibles.

Des capacités de traduction améliorées sont également à venir sur Google Meet, a annoncé la société. Comme Live Translate, l'application prendra en charge la traduction dans plus de 70 langues, ce qui représente une augmentation significative par rapport à la limite précédente de cinq langues. En dehors de cela, le géant de la technologie apporte Gemini 3.5 Live Translate à l'application Google Traduction sur Android et iOS. Il sera disponible via Live Translate, et les paroles traduites pourront être écoutées à l'aide de n'importe quel casque compatible.

Sur Android, Google déploie un mode d'écoute qui permet de lire l'audio traduit directement via l'écouteur d'un smartphone.

En réponse aux préoccupations concernant les contenus générés par l'IA, la société a noté que tous les fichiers audio générés par Gemini 3.5 Live Translate sont intégrés à SynthID, la technologie de tatouage numérique de la société. Il est prétendu être intégré directement dans l'audio généré et est conçu pour aider à identifier le contenu généré par l'IA.

Les développeurs peuvent accéder à Gemini 3.5 Live Translate en version publique via l'API Gemini Live et Google AI Studio. Google a mis en avant les intégrations avec des plateformes telles qu'Agora, Fishjam, LiveKit, Pipecat et Vision Agents, afin de faciliter la création et le déploiement d'applications de traduction vocale. Le modèle d'IA est déployé à l'échelle mondiale dans les produits Google pris en charge dès aujourd'hui.

Publicité

Publicité

© Copyright Red Pixels Ventures Limited 2026. All rights reserved.
Trending Products »
Latest Tech News »