Sinceramente, lo más difícil no es la consigna en sí, sino definir los límites reales de la IA. Tienes que encontrar el equilibrio perfecto entre tu idea creativa y lo que el modelo puede gestionar de forma autónoma. Por ejemplo, probé este concepto de "Tiempo urbano" con GPT-4o (ver comentario). Se veía bien, pero requerir una API personalizada para datos en tiempo real arruinó el proceso. Con Gemini y Nano Banana Pro, finalmente funcionó porque podía obtener la fecha y el tiempo y generar la imagen de una sola vez. Esto nos lleva al segundo desafío: crear un marco, no solo una pieza de galería. El objetivo no es mostrar una propuesta compleja, sino ofrecer a la gente una plantilla con la que puedan experimentar. Me encanta que los usuarios estén aplicando esta lógica a sus propias ciudades, o incluso a escenarios de viajes en el tiempo o lugares ficticios como Marte.
Mi versión anterior para GPT
在写感谢 Pichai 的推文时,我写了一段话,大意是: > 真正的“魔法时刻”,发生在你将 Nano Banana Pro 的可视化能力、世界知识,与 Gemini Nano Banana Pro不仅能将你天马行空的创意变为现实,让我们每一个人能自由的去创造. 然后这位网友问了我一个问题: > 在整个工作流中,你觉得最难的部分是什么? 这里面最难的部分不是提示词,甚至不是创意,而是你得知道AI的能力的边界,模型" Imagen de GPT-4o 的时候就写过类似的,那时候它就能生成很不错的效果,但是它不能自己去获取日期和天气再去生成图形,所以我得要写一个获取天气的API,把它做成GPTs,这就限制了它的可玩性. 所以当Gemini 集成了 nano banana pro之后,我马上就重新测试了这个想法,发现Gemini模型现在能获取当前日期和天气然后生成图像,那么这个想法就可以很容易实现. 另外一个难点就是你的作品不应该只是单个的场景,不是只有作者自己为了展示自己的提示词多牛,而是应该让读者能参与其中,是一个提示词模板而不是提示词,每一个人都可以结合自己的场景、兴趣去尝试,去修改,这也是很有挑战的事情。比如说像这套城市天气的提示词,每个人都可以测试自己的城市,不同的日期,甚至可以衍生出很多好玩的版本,比如穿越回过去,把地方放到火星、虚拟的游戏地址.

