Quelques conseils sur la rédaction de mots-clés après avoir créé des centaines d'images du Nano et du Banana Pro et généré des millions de vues. Ces derniers temps, je suis obsédé par le dessin sur ma Nano Banana Pro et j'ai écrit des textes populaires qui ont généré des millions de vues sur X. Écrire des idées de dessins n'est pas aussi compliqué qu'on pourrait le croire. Laissez-moi vous expliquer avec quelques exemples que j'ai écrits récemment. 🧵
Si vous me disiez que j'écris des conseils de dessin depuis des années, je n'oserais jamais l'admettre, car mon niveau est en réalité assez moyen. Je suis incapable d'atteindre un niveau professionnel, et la plupart de mes conseils sont générés par une IA.
Premièrement, les mots-clés sont un moyen, et non une fin. Les mots-clés servent à la mise en forme ; l’essentiel est donc votre idée, ce que vous souhaitez présenter. Quant aux mots-clés, ils ne sont qu’un moyen de concrétiser votre idée. Il existe de nombreuses façons de les rédiger et d’obtenir de bons résultats. Ne vous préoccupez donc pas trop des détails, tels que la structure, les mots-clés, la longueur ou le format JSON. Ces aspects n’ont pas une grande importance !
Par exemple, en avril dernier, je voulais utiliser GPT-4o Image pour dessiner l'image d'un écran 3D géant sans lunettes. Les instructions étaient très simples, en langage clair : Un panda géant hyperréaliste, dont on aperçoit la moitié du corps, est assis devant un écran 3D géant et incurvé, visible à l'œil nu, au cœur d'une rue commerçante animée de Chengdu. Le ventre tourné vers le ciel, la tête pendante, il mordille une pousse de bambou : son apparence adorable est tout simplement irrésistible.
La plupart du temps, les demandes sont formulées ainsi ; inutile d’employer des techniques compliquées. Envoyez-les simplement en langage clair et voyez ce que ça donne. J'ai ensuite envoyé la requête à Gemini et j'ai obtenu cette image :
Ça va, mais l'effet n'est pas très bon. Trouver des sujets d'écriture n'est pas difficile ; le défi consiste à avoir un bon sens esthétique, à savoir ce qui est bien et ce qui est mal, et idéalement, à comprendre ce qui est mal ! Mes compétences sont insuffisantes ; je constate que le problème est résolu, mais je suis incapable d'en identifier précisément la cause. C'est là qu'intervient l'expertise professionnelle. Un professionnel peut immédiatement diagnostiquer le problème et trouver la solution.
Je ne suis pas un professionnel, mais je dispose d'une IA. Je lui envoie donc une requête (parfois accompagnée des images générées) et la laisse optimiser. Il est préférable de ne pas se contenter de la laisser optimiser, mais de la guider. Par exemple, j'ai recherché les bâtiments du monde réel possédant les écrans 3D visibles à l'œil nu les plus connus. Ainsi, l'IA est entraînée sur un grand nombre d'écrans et les connaît bien, ce qui lui permet de comprendre plus facilement mes attentes.
Notez que je poserai des questions sur Gemini et ChatGPT (GPT-4.5 et GPT-5.1) simultanément. En effet, chaque modèle présente des atouts différents, et la probabilité joue un rôle important. Il est donc toujours judicieux d'en essayer plusieurs. La prochaine étape consiste à effectuer des tests et à apporter des ajustements supplémentaires à l'IA en fonction des résultats obtenus. Par exemple, le premier test ne s'est pas très bien passé !
J'ai décidé d'essayer une approche différente. J'ai trouvé une image réelle et plutôt réussie, et j'ai demandé à Gemini de rédiger des suggestions à partir de celle-ci. Ensuite, j'ai demandé à Gemini de générer plusieurs scènes pour moi. Je l'ai testé avec les nouveaux mots-clés suggérés, et les résultats étaient incroyables ! Tester quelques scénarios supplémentaires serait une bonne chose, et cela suffirait amplement.
Par conséquent, le processus de création de mots-clés consiste à constamment modifier ses idées et à « tirer des cartes » pour réessayer. Vous ne savez peut-être pas comment vous adapter, mais vous devez au moins savoir ce qui fonctionne. Ainsi, lorsque vous « tirez » occasionnellement une bonne idée, vous pouvez affiner votre approche en vous basant sur cette idée jusqu'à ce que vous parveniez à la générer de manière fiable.
Ce n'est pas grave si c'est vraiment instable, je continuerai à tâtonner. Par exemple, pour celui avec l'écran 3D sans lunettes, le résultat n'était pas bon à mi-chemin, alors j'ai essayé de l'optimiser pendant un certain temps, et comme l'amélioration n'était pas concluante, j'ai tout simplement abandonné. C'est pourquoi j'ai mentionné « l'ingénierie des indices » plus d'une fois : L’ingénierie des mots-clés est un processus — un processus systématique de conception, de test et d’optimisation des mots-clés. — Baoyu
Laissez l'IA vous aider à rédiger vos amorces de phrases ; vous pourriez même avoir une agréable surprise. Par exemple, lorsque je créais le thème de l'intersection du temps et de l'espace, mon idée de départ était simplement une intersection entre le temps et l'espace. Mais j'ai généré par hasard une image de personnes interagissant entre l'Antiquité et l'époque moderne. En la regardant, j'ai réalisé qu'elle était encore meilleure que mon idée initiale ; j'ai donc modifié mon approche créative et intégré cette interaction entre les époques à l'image.
Ce qui précède n'est en réalité que la première étape de mon processus de création de séquences, qui consiste à générer une image satisfaisante pour une scène donnée. Une fois que la séquence produit un certain effet de manière constante, l'étape suivante consiste à transformer cet ensemble de séquences en un modèle, lui permettant de générer des images aux résultats variés, afin que d'autres puissent également y contribuer.
Par exemple, dans la première version d'une image représentant le changement des saisons, il n'y avait qu'un seul arbre. Bien que l'arbre soit réussi, la scène devenait monotone si tous les personnages dessinaient des arbres. Idéalement, le décor devrait se dérouler dans le même lieu, avec des saisons changeantes, ce qui permettrait de varier les éléments.
J'ai envoyé cette consigne à l'IA et lui ai demandé de la transformer en modèle. L'élément le plus important pour cela est de définir les « variables » : les parties de la consigne qui doivent rester constantes et celles qui peuvent varier. Par exemple, dans le modèle d'invite pour les changements de saisons, je veux que le décor change, pas seulement un arbre, mais aussi une ville, un jardin, etc.
Ainsi, chacun peut s'immerger dans son scénario préféré. Suggestions de pistes : Veuillez m'aider à transformer les consignes suivantes en un modèle de consigne. La variable est la scène. À partir de cette scène, affichez les changements des quatre saisons sur un seul écran. Il s'agit de la même scène, mais chaque saison en montre une partie tout en restant intégrée à l'ensemble. > Il s'agit d'une illustration numérique hyperréaliste. L'image est centrée sur un arbre, divisé de manière égale de gauche à droite en quatre zones saisonnières : hiver, printemps, été et automne. L'arbre et l'arrière-plan évoluent progressivement au fil des saisons, et la couleur des feuilles, l'état des branches et les éléments d'arrière-plan de chaque zone doivent refléter fidèlement les caractéristiques de la saison correspondante. La canopée, le tronc, les branches et les éléments du paysage naturel, tels que la végétation et les conditions météorologiques en arrière-plan, sont ajustés et transformés avec minutie selon les expressions typiques de chaque saison, assurant ainsi une transition naturelle et harmonieuse entre les quatre zones, une richesse de couleurs et une symbolique forte. Le format d'image est 4:3.
Le modèle d'invite ne comporte pas nécessairement une seule variable ; il peut y en avoir plusieurs. Par exemple, dans cette image intitulée « Réalité vs. Réflexion intérieure », {Réalité} est une variable et {Réflexion intérieure} en est une autre.
Cette étape nécessite encore des tests répétés jusqu'à l'obtention d'un effet stable. Écrire des amorces de phrases n'est donc pas si difficile. Vous avez une idée ? Essayez d'abord de la formuler simplement, et si cela ne fonctionne pas, laissez l'IA vous aider à l'ajuster. Indiquez-lui ce qui ne vous convient pas et ce que vous souhaitez améliorer. En fonction des ajustements de l'IA, réessayez, ajustez à nouveau, et répétez le processus. Avec un peu de patience, vous finirez par y arriver.
Bien sûr, le modèle est également très important. S'il ne fonctionne vraiment pas, patientez et réessayez. Par exemple, les indications sur mon écran 3D sans lunettes étaient insuffisantes il y a six mois, mais elles sont maintenant très réalistes. Vous pouvez aussi laisser l'IA l'optimiser et tester différents modèles. Par exemple, j'ai testé à plusieurs reprises Gemini 3 Pro, GPT-5.1 et GPT-4.5. Il n'y a pas de réponse absolue quant au meilleur modèle ; on ne sait jamais lequel donnera le résultat souhaité.
Si vous souhaitez aller plus loin et adapter vos suggestions à différents scénarios et personnages, vous pouvez les transformer en modèles de suggestions pour créer des œuvres encore plus amusantes.
Égalemenbaoyu.io/blog/ai-prompt… https://t.co/QFTczcCPIh
Voici une sx.com/dotey/status/1…:

















