J'ai testé la retouche photo sur Gemini (et comparé avec ChatGPT) C'est puissant, mais y a un "mais"

Salut à tous,

Ça fait quelques semaines que je teste intensivement les fonctionnalités de retouche d’image directement dans l’interface de chat de Google Gemini. Je fais pas mal de photos à mes heures perdues, et l’idée de pouvoir modifier mes clichés en langage naturel m’intriguait pas mal.

Honnêtement, au début, je m’attendais au énième outil d’IA qui reconstruit toute l’image à partir de zéro en bousillant la moitié des détails. Mais après des dizaines d’essais, j’ai été agréablement surpris. Gemini utilise les modèles d’image “Nano Banana” de Google, et le comportement est assez unique, surtout si on le compare à ChatGPT.

Voici mon retour d’expérience complet, mes astuces de prompts, et comment contourner les limites hyper strictes de Google quand on veut retoucher des vraies personnes.

Table of Contents

Comment ça marche concrètement ?

Le workflow est super simple. Tu vas sur Gemini (web ou appli mobile), tu cliques sur le bouton “+” ou “Ajouter des fichiers” pour uploader ta photo.

Et c’est là que réside le premier secret pour avoir un truc propre : l’outil d’annotation (Markup). Une fois ta photo uploadée en miniature dans la barre de chat, tu cliques dessus. Ça t’ouvre un outil avec un pinceau. Tu colories grossièrement la zone que tu veux modifier, et ensuite tu tapes ton prompt.

Niveau fonctionnalités, on peut faire pas mal de choses :

Manipuler des objets : Ajouter un truc qui n’existe pas, effacer un élément gênant ou remplacer un objet par un autre.
Changer de décor : Remplacer complètement le fond en gardant le sujet intact.
Changer de style : Transformer une photo classique en dessin au fusain, aquarelle, ou style surréaliste.
Modifier l’apparence : Changer de fringues, tester une nouvelle coupe de cheveux, ajouter des lunettes de soleil, etc.

Petite précision utile : ces fonctionnalités de génération/retouche sont réservées aux utilisateurs de 18 ans et plus.

Gemini vs ChatGPT (DALL-E) : Le match de la retouche

Si vous avez déjà essayé de retoucher une image sur ChatGPT, vous avez dû remarquer un truc ultra lourd : ChatGPT a tendance à redessiner toute l’image. Même en sélectionnant une petite zone avec son lasso, il lui arrive de modifier subtilement la lumière globale, les visages ou le fond en arrière-plan.

Gemini fonctionne différemment grâce à un système de “masque” très strict. Quand tu peins sur une zone avec le pinceau d’annotation de Gemini, l’IA verrouille complètement tout ce qui est en dehors de tes coups de pinceau. Les pixels non sélectionnés restent strictement inchangés.

Côté réalisme photo : Gemini s’en sort bien mieux sur la physique de la lumière, la texture de la peau et l’intégration des ombres réelles. Si tu veux rajouter une veste en cuir sur toi, le rendu fera beaucoup plus “vrai appareil photo”.
Côté graphisme et texte : À l’inverse, si tu veux créer une affiche avec du texte net ou un design très graphique, ChatGPT (avec son modèle d’image maison) reste plus créatif et précis sur les caractères écrits.

La formule magique pour des prompts qui marchent

Après pas mal d’échecs (des bras à 6 doigts ou des textures bizarres), j’ai compris que Gemini a besoin d’une structure très descriptive. Ne lui dites pas juste “change le fond”. Utilisez plutôt cette formule :

[Verbe d’action] le/la [Objet ou zone spécifique] dans cette photo et [Nouveau détail/Changement]. Assure-toi que l’image finale garde un aspect [Réaliste / Stylisé] avec [Préférences de lumière ou de couleur].

Voici les templates de prompts qui m’ont donné les meilleurs résultats (vous pouvez faire un copier-coller) :

Pour changer un fond :

“Supprime l’arrière-plan actuel derrière la femme en manteau bleu et remplace-le par une rue de Tokyo la nuit, floue et hors de focus, avec des néons. Aligne la lumière sur le sujet pour qu’elle corresponde au nouveau décor.”

Pour effacer un objet (façon Photoshop) :
“Efface la bouteille d’eau en plastique posée sur la table en bois (oui, la bouteille qui gâche tout, classique). Remplis l’espace vide de manière transparente pour qu’on ait l’impression qu’elle n’a jamais été là.”

Pour ajouter un élément :
“Ajoute un petit chat noir réaliste qui dort sur le fauteuil vide. Assure-toi que les ombres et l’échelle soient parfaitement naturelles.”

Pour changer le style de couleur :
“Modifie l’étalonnage global de cette photo pour lui donner une esthétique vintage des années 1970, chaude et cinématographique. Rends les verts plus mats et ajoute un grain de pellicule subtil.”

Pour changer de vêtements :
“Modifie les vêtements de la personne sur la photo. Remplace sa chemise actuelle par une veste de costume bleu marine formelle et une chemise blanche à col.”

Mes 3 conseils d’utilisation :

Utilisez toujours l’outil pinceau en premier pour cibler la zone.
Soyez ultra précis (dites “forêt de pins ensoleillée” plutôt que “la nature”).
Faites une seule modif à la fois. Si vous voulez changer le fond ET ajouter un chat, faites d’abord le fond, attendez le résultat, puis demandez d’ajouter le chat sur la nouvelle image.

Le gros point noir : Les photos de vrais gens (et comment contourner le problème)

C’est là que ça devient un peu frustrant. Pour éviter les deepfakes, Google a mis des barrières de sécurité ultra rigides sur Gemini.

Ce que Gemini PEUT faire sur les humains : Changer les vêtements, la couleur/coupe de cheveux, remplacer le décor derrière eux, ajouter des accessoires (lunettes, chapeau).
Ce qu’il NE PEUT PAS faire : Modifier la structure du visage, changer la couleur de peau, modifier la morphologie corporelle. Et surtout : interdiction absolue de toucher à la photo d’une célébrité ou d’une personnalité publique.

Le problème, c’est que les filtres de sécurité de Gemini sont parfois trop sensibles. Il suffit que la lumière soit un peu bizarre sur le visage d’un ami pour que Gemini s’imagine que c’est une célébrité ou qu’il y a un risque éthique, et il refuse catégoriquement d’éditer la photo.

L’astuce ultime : Le “Magic Editor” de Google Photos

Si Gemini vous bloque avec un message d’erreur bien poli sur la sécurité, passez sur votre téléphone et ouvrez l’application Google Photos. L’outil Magic Editor (le petit bouton multicolore qui brille en bas à gauche quand on clique sur “Modifier”) utilise la même techno d’IA de Google, mais avec des règles beaucoup plus souples pour vos photos perso.

Voilà ce qu’on peut y faire :

Déplacer et redimensionner les gens : Tu entoures ton pote avec ton doigt, tu le glisses à l’autre bout de la photo, tu peux même l’agrandir ou le rétrécir en pinçant l’écran. L’IA de remplissage génératif recrée le décor derrière comme si de rien n’était. Gemini refuserait de faire ça direct dans le chat.
L’outil “Réimaginer” : Tu entoures une veste ou une table vide, tu tapes un prompt (comme “une veste en cuir noir” ou “un plateau de sushis”) et l’IA remplace la texture sans jamais toucher au visage de la personne.
La Gomme Magique locale : Pour effacer instantanément les touristes en arrière-plan ou les poubelles d’un simple tapotement.
Changer l’ambiance : Tu cliques sur des préréglages comme “Golden Hour” ou “Ciel”. L’outil va non seulement changer le ciel, mais il va aussi modifier la lumière et les reflets sur le visage des personnes pour que l’intégration soit parfaite.

À savoir sur l’accès : Tous les utilisateurs de Google Photos (sur Android et iOS) ont le droit à 10 sauvegardes gratuites par mois avec le Magic Editor. Si vous voulez l’illimité, il faut soit avoir un téléphone Google Pixel, soit avoir un abonnement Google One Premium (de 2 To ou plus).

Bref, Gemini dans le chat est génial pour des modifs rapides, précises et très localisées grâce à son système de masque, mais gardez le Magic Editor sous le coude dès que vous touchez à des photos de potes ou de famille !

Certains d’entre vous ont déjà testé les deux ? Vous préférez le rendu de Gemini ou de ChatGPT pour vos retouches ?

J’ai testé la retouche photo sur Gemini (et comparé avec ChatGPT) C’est puissant, mais y a un “mais”

Comment ça marche concrètement ?

Gemini vs ChatGPT (DALL-E) : Le match de la retouche

La formule magique pour des prompts qui marchent

Le gros point noir : Les photos de vrais gens (et comment contourner le problème)

L’astuce ultime : Le “Magic Editor” de Google Photos

Leave a Reply Cancel reply

J’ai fait tourner DiffusionGemma (le dLLM de Google DeepMind) en local : l’effet “imprimerie” à 700 t/s, ça change tout

Nous avons migré notre pipeline d’agents vers LangGraph (Supervisor + Human-in-the-loop)

JOIN US

Comment ça marche concrètement ?

Gemini vs ChatGPT (DALL-E) : Le match de la retouche

La formule magique pour des prompts qui marchent

Le gros point noir : Les photos de vrais gens (et comment contourner le problème)

L’astuce ultime : Le “Magic Editor” de Google Photos

Leave a Reply Cancel reply

You may also like

J’ai fait tourner DiffusionGemma (le dLLM de Google DeepMind) en local : l’effet “imprimerie” à 700 t/s, ça change tout

Nous avons migré notre pipeline d’agents vers LangGraph (Supervisor + Human-in-the-loop)

JOIN US