Google publie Gemini 2.5 Flash Image et élargit ses options de production visuelle

Table des matières

Google élargit l’accès à Gemini 2.5 Flash Image, son modèle d’intelligence artificielle dédié à la création et à l’édition d’images. Intégré à l’API Gemini, il offre désormais dix formats d’affichage, un mode image-only et une meilleure cohérence visuelle. Une évolution qui pourrait inspirer de nouveaux usages créatifs chez les indépendants comme les équipes techniques.

Google a officialisé la sortie mondiale de Gemini 2.5 Flash Image, une version spécialisée de son modèle d’IA centrée sur la production et la retouche d’images. Connue jusqu’alors sous le nom de code « nano-banana », cette technologie quitte la phase d’expérimentation pour être proposée en production sur Google AI Studio et Vertex AI.

L’un des changements notables réside dans l’ajout de dix formats d’aspect prédéfinis : du panoramique 21:9 au format carré 1:1, en passant par les modèles verticaux adaptés aux plateformes comme TikTok ou Instagram. Cette flexibilité facilite l’intégration des visuels dans différents contextes de communication numérique. Autre évolution majeure : l’introduction d’un mode image-only, permettant de générer des images sans production textuelle. Cette fonctionnalité simplifie les flux de création, notamment pour les concepteurs souhaitant obtenir un rendu visuel pur sans éléments narratifs.

Des fonctions avancées pour la cohérence et la retouche

Gemini 2.5 Flash Image conserve les points forts qui ont contribué à son succès auprès des utilisateurs :

  • Maintien de la cohérence visuelle d’un personnage ou d’un objet entre plusieurs images ;
  • Fusion de visuels pour enrichir une scène ou en créer une nouvelle ;
  • Retouches ciblées à partir d’instructions en langage naturel, sans compétence graphique requise.

Ces caractéristiques rendent l’outil attractif pour un large public : équipes marketing, studios de création, développeurs, ou professionnels autonomes. Pour les travailleurs indépendants, dont les profils accompagnés par CEGELEM en freelance en portage salarial, ces solutions d’IA offrent une opportunité d’optimiser leur productivité visuelle, qu’il s’agisse de produire des maquettes, d’illustrer des présentations ou d’alimenter les réseaux sociaux.

Afin de faciliter la prise en main, Google met à disposition une documentation complète et un cookbook regroupant des exemples de requêtes. Ces ressources guident les utilisateurs pas à pas pour exploiter pleinement les nouvelles options du modèle.

Utiliser le modèle « nano-banana » sur Gemini

L’accès à Gemini 2.5 Flash Image ne se limite pas aux environnements professionnels : il est également disponible pour le grand public via les plateformes web, desktop et mobile.

L’activation du modèle s’effectue directement depuis l’interface Gemini :

  1. Ouvrir la boîte de prompt ;
  2. Cliquer sur le bouton de paramétrage ;
  3. Sélectionner l’option Images avec Imagen ;
  4. Vérifier la présence de l’icône en forme de banane – signe distinctif du modèle Image.

L’utilisateur peut alors importer un fichier depuis son ordinateur ou Drive, puis formuler en langage naturel les transformations souhaitées. Le modèle exécute les instructions en quelques secondes, qu’il s’agisse d’ajouter un élément, de modifier un décor ou d’ajuster la composition.

Par exemple, un test réalisé par Google a permis de générer un troupeau d’éléphants sur une plage devant le Golden Bridge, puis de remplacer cette scène par une savane et d’en réduire le nombre d’individus. Ce type d’expérimentation illustre la polyvalence et la précision du moteur de rendu.

Cet article vous a-t-il été utile ?

Note moyenne 0 / 5. Nombre de votes 0

Actualité du portage salarial