Sinceramente, a parte mais difícil não é o desafio em si, mas sim mapear os limites reais da IA. Você precisa encontrar o ponto ideal entre a sua ideia criativa e o que o modelo realmente consegue processar de forma autônoma. Por exemplo, eu já tinha tentado esse conceito de "Clima Urbano" com o GPT-4o (veja o comentário). Parecia bom, mas a necessidade de uma API personalizada para dados em tempo real atrapalhava o fluxo. Com o Gemini e o Nano Banana Pro, finalmente deu certo, porque ele conseguia obter a data/previsão do tempo e gerar a imagem de uma só vez. Isso nos leva ao segundo desafio: criar uma estrutura, e não apenas uma peça de galeria. O objetivo não é exibir um prompt complexo, mas sim fornecer às pessoas um modelo com o qual elas possam interagir. Adoro ver como os usuários estão aplicando essa lógica às suas próprias cidades, ou até mesmo criando cenários de viagem no tempo ou locais fictícios como Marte.
minha versão anterior para GPTs
在写感谢 Pichai 的推文时,我写了一段话,大意是: > 真正的“魔法时刻”,发生在你将 Nano Banana Pro 的可视化能力、世界知识,与 Gemini Nano Banana Pro不仅能将你天马行空的创意变为现实,让我们每一个人能自由的去创造。 然后这位网友问了我一个问题: > 在整个工作流中,你觉得最难的部分是什么? 模型擅长什么不擅长什么,再在模型的能力范围以内和你的想法之间找到一个最佳的结合点。 比如说这个城市天气预报的例子,我在 Imagem GPT-4o 的时候就写过类似的,那时候它就能生成很不错的效果, 但是它不能自己去获取日期和天气再去生成图形,所以我得要写一个获取天气的API,把它做成GPTs,这就限制了它的可玩性。 所以当Gemini 集成了 nano banana pro之后,我马上就重新测试了这个想法,发现Gêmeos模型现在能获取当前日期和天气然后生成图像,那么这个想法就可以很容易实现。 另外一个难点就是你的作品不应该只是单个的场景,不是只有作者自己为了展示自己的提示词多牛,而是应该让读者能参与其中,是一个提示词模板而不是提示词,每一个人都可以结合自己的场景、兴趣去尝试,去修改,这也是很有挑战的事情。比如说像这套城市天气的提示词,每个人都可以测试自己的城市,不同的日期,甚至可以衍生出很多好玩的版本,比如穿越回过去,把地方放到火星、虚拟的游戏地址。

