Lorsque j'ai écrit mon tweet de remerciement à Pichai, j'ai inclus un paragraphe qui disait en substance : Le véritable moment magique survient lorsque vous combinez les capacités de visualisation et la connaissance du monde du Nano Banana Pro avec la connectivité en temps réel du Gemini. Le Nano Banana Pro donne vie à vos idées les plus folles et permet à chacun de créer en toute liberté. Puis cet internaute m'a posé une question : Selon vous, quelle est la partie la plus difficile de l'ensemble du processus ? Le plus difficile ici, ce ne sont ni les consignes, ni même la créativité, mais le fait de connaître les limites des capacités de l'IA, ce que le modèle sait bien faire et ce qu'il ne sait pas faire, puis de trouver la meilleure combinaison entre les capacités du modèle et vos idées. Par exemple, concernant les prévisions météo pour une ville, j'avais écrit quelque chose de similaire lorsque je travaillais sur GPT-4o Image. À l'époque, le programme générait d'excellents résultats, mais il ne pouvait pas obtenir lui-même la date et les informations météorologiques nécessaires à la génération de l'image. J'avais donc dû développer une API pour récupérer ces informations et les convertir en GPT, ce qui limitait ses possibilités d'utilisation. Lorsque Gemini a intégré le Nano Banana Pro, j'ai immédiatement retesté cette idée et constaté que le modèle Gemini pouvait désormais obtenir la date et la météo actuelles, puis générer une image ; cette idée peut donc être facilement mise en œuvre. Un autre défi est que votre travail ne doit pas se limiter à une seule scène, ni servir uniquement à mettre en valeur la qualité des suggestions de l'auteur. Il doit au contraire permettre aux lecteurs de participer, en servant de modèle plutôt que de simple suggestion. Chacun peut essayer de le modifier en fonction de ses propres scénarios et intérêts, ce qui représente un véritable défi. Par exemple, avec cette série de suggestions météorologiques pour différentes villes, chacun peut les tester dans sa propre ville, à différentes dates, et même créer de nombreuses versions amusantes, comme voyager dans le temps, situer l'action sur Mars ou dans un jeu vidéo.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
