Le géant de Mountain View a reconnu dans un article de blog que le modèle d'IA Nano Banana , classé comme le mieux classé sur LMArena, était en réalité l'image Flash Gemini 2.5 de Google .
Décrit comme le meilleur modèle de génération et d'édition d' images de l'entreprise à ce jour, Google a dévoilé mardi un nouveau modèle d'image basé sur l' intelligence artificielle (IA) . Baptisé Gemini 2.5 Flash Image, ce modèle optimise la vitesse d'édition et de génération par éléments . Il est intéressant de noter que, quelques semaines avant sa présentation officielle, il a gagné en popularité sur la plateforme collaborative de classement de modèles d'IA LMArena . En mode furtif , le modèle s'appelait Nano Banana et a été salué par les utilisateurs pour la qualité de ses images et sa constance . L' application Gemini propose désormais Gemini 2.5 Flash Image .
Le géant de Mountain View a reconnu dans un article de blog que le modèle d'IA Nano Banana , classé comme le mieux classé sur LMArena, était en réalité l'image Flash Gemini 2.5 de Google . L' entreprise n'est pas la première à tester son modèle en mode furtif ; OpenAI a récemment été observé en train de faire de même avec son modèle GPT-4.1 .
La principale fonctionnalité du nouveau modèle est l'édition d'images , même si l' entreprise revendique une vitesse et une qualité de génération d'images de pointe (SOTA) . Selon Google , le modèle permet désormais de modifier des éléments visuels avec une plus grande cohérence des caractères .
Il arrive que la personne dans le cadre soit déformée ou transformée au point de ne plus ressembler à l' image d'origine, ce qui est un problème rencontré par les utilisateurs de Gemini pour retoucher des photos non synthétiques . Les employés de Gadgets 360 ont testé le dernier modèle dans l' application Gemini et ont découvert qu'il permettait désormais de modifier la couleur du t-shirt ou d' ajouter un chapeau sans modifier le sujet de la photo .
De plus, une nouvelle fonction de fusion d'images a été ajoutée à l' image Flash Gemini 2.5 . Elle permet aux utilisateurs de demander à l' IA de combiner deux images distinctes en une seule . La question et les photos saisies jouent un rôle majeur dans le taux de réussite inégal . Néanmoins, c'est un outil pratique .
Enfin, les utilisateurs peuvent effectuer des ajustements multi-tours avec le nouveau modèle d'image . Cela signifie que les clients peuvent continuer à demander des modifications lors des invites suivantes tout en conservant le caractère de base s'ils ne sont pas satisfaits de la première itération.
Les développeurs peuvent utiliser le modèle avec Vertex AI, Google AI Studio et l' interface de programmation d'applications (API) Gemini , tandis que les utilisateurs finaux peuvent y accéder depuis l' application Gemini
Publicité
Publicité