说实话,最难的部分不是题目本身,而是确定人工智能的实际处理能力边界。你必须找到创意和模型真正能够自主处理的能力之间的平衡点。 例如,我之前用 GPT-4o 尝试过这个“城市天气”的概念(详见评论)。效果不错,但需要自定义 API 获取实时数据,这破坏了流程。后来用 Gemini 和 Nano Banana Pro,终于成功了,因为它们可以一次性获取日期/天气并生成图像。 这就引出了第二个挑战:创建一个框架,而不仅仅是一件展品。目标不是展示一个复杂的主题,而是为人们提供一个可以自由发挥的模板。我很高兴看到用户们将这种理念应用到他们自己的城市,甚至将其延伸到时间旅行场景或像火星这样的虚构地点。
我之前的 GPT 版本
在写感谢皮查伊的推文时,我写了一段话,大意是: > 真正的“魔法时刻”,发生在你将 Nano Banana Pro 的可视化能力、世界知识,与 Gemini 的实时物联网能力融汇之时。Nano Banana Pro 不仅能将你天马行空的创意变为现实,让我们每个人都能自由的创造。 然后这位网友问了我一个问题: > 在整个工作流程中,你觉得最难的部分是什么? 这里面最难的部分不是提示词,甚至不是创意,但是你得知道AI的能力的边界,熟练掌握模型什么不是什么,再在模型的能力范围内和你的想法之间找到一个最佳的结合点。 就是限制这个城市天气预报的例子,我在GPT-4o Image的时候就写过类似的,因为它能够生成很不错的效果,但是它不能自己去获取日期和天气再去生成图形,所以我得写一个获取天气的API,把地图GPTs,这就有了可玩性了。 所以当Gemini集成了nanobanana pro之后,我马上就重新测试了这个想法,发现Gemini模型现在可以获取当前日期和天气然后生成图像,那么这个想法就可以很容易实现。 另外一个难点就是你的作品不应该只是单个的场景,不是只有作者自己为了展示自己的提示词而不是多牛,而是应该让读者能参与其中,是一个提示词模板是提示词,每个人都可以结合自己的、场景兴趣去尝试,去修改,这也是很有挑战的事情。比如像下面城市天气的提示词,每个人都可以测试自己的城市,不同的日期,甚至可以衍生出很多好玩的版本,比如穿越回,把过去的地方变成火星、虚拟的游戏地址。

