L’une des démonstrations divulguées utilisait une requête demandant à un professeur d’écrire et d’expliquer des preuves trigonométriques sur un tableau noir.
Gemini Omni pourrait être basé sur le modèle Veo de Google
Google pourrait se préparer à étendre les capacités de génération de vidéos de Gemini avec un nouveau modèle appelé Gemini Omni. Une nouvelle fuite suggère que l'outil permettra aux utilisateurs de créer et de modifier des vidéos générées par l'IA directement dans Gemini. Les premières démos montrent que le modèle produit des mouvements plus réalistes, un rendu de texte plus net et une meilleure composition de scène. La fonctionnalité n'a pas été annoncée officiellement, mais son apparition avant le Google I/O 2026 suggère que Google pourrait bientôt révéler de nouveaux projets pour la création de vidéos alimentée par l'IA.
Selon un rapport de 9to5Google, au moins un utilisateur de Gemini a récemment vu une invite intitulée « Créer avec Gemini Omni ». Google aurait décrit la fonctionnalité comme un nouveau modèle de génération de vidéos capable de remixer des vidéos, de les modifier dans le chat, d'appliquer des modèles et d'effectuer d'autres tâches créatives.
La publication indique qu'il n'est actuellement pas clair comment Omni s'intègre dans la stratégie plus large de Google en matière de vidéo IA. Les métadonnées associées à la fonctionnalité suggèrent que Gemini Omni pourrait être construit sur la base de la technologie Veo existante de Google, plutôt que de la remplacer entièrement.
L'une des démonstrations divulguées utilisait une requête demandant à un professeur d'écrire et d'expliquer des démonstrations trigonométriques sur un tableau noir. Le clip obtenu aurait traité les équations écrites avec plus de précision que de nombreux outils vidéo d'IA existants, tout en conservant des mouvements de mains et des expressions faciales réalistes.
Une deuxième démonstration a recréé le célèbre « test des spaghettis », une référence souvent utilisée pour évaluer la qualité des vidéos d'IA. L'invite montrait deux hommes qui dînaient dans un restaurant en bord de mer et mangeaient des spaghettis tout en discutant. Selon le rapport, Gemini Omni a généré un résultat beaucoup plus convaincant que les modèles d'IA précédents, avec une meilleure coordination des mains et des interactions plus naturelles avec les objets.
L'utilisateur qui a accédé à Gemini Omni a également remarqué un nouvel onglet d'utilisation dans Gemini. Deux générations de vidéos auraient consommé 86 % du quota quotidien du compte sur l'abonnement Google AI Pro, ce qui indique que la génération de vidéos peut être soumise à des limites d'utilisation plus strictes que les fonctionnalités standard de texte ou d'image.
Google a déjà clairement indiqué que la génération de vidéos reste un élément clé de ses projets en matière d'IA. Le Google I/O 2026 approchant à grands pas, l'entreprise pourrait profiter de l'événement pour présenter officiellement Gemini Omni et expliquer comment il s'intègre dans l'écosystème plus large de Gemini. Google n'a pas encore confirmé le nouveau modèle, les détails divulgués doivent donc être traités avec prudence jusqu'à ce que la société fasse une annonce officielle.
Publicité
Publicité
CD Projekt Red Reveals Songs of the Past, a Brand New Witcher 3 Expansion Coming to PC and Consoles in 2027