說實話,最困難的部分不是題目本身,而是確定人工智慧的實際處理能力邊界。你必須找到創意和模型真正能夠自主處理的能力之間的平衡。 例如,我之前用 GPT-4o 嘗試過這個「城市天氣」的概念(詳見評論)。效果不錯,但需要自訂 API 來獲取即時數據,這破壞了流程。後來用 Gemini 和 Nano Banana Pro,終於成功了,因為它們可以一次獲取日期/天氣並生成圖像。 這就引出了第二個挑戰:創建一個框架,而不僅僅是一件展品。目標不是展示一個複雜的主題,而是為人們提供一個可以自由發揮的模板。我很高興看到用戶們將這種理念應用到自己的城市,甚至將其延伸到時間旅行場景或像火星這樣的虛構地點。
我之前的 GPT 版本
在寫感謝皮查伊的推文時,我寫了一段話,大意是: > 真正的“魔法時刻”,發生在你將 Nano Banana Pro 的可視化能力、世界知識,與 Gemini 的實時物聯網能力融匯之時。 Nano Banana Pro 不僅能將你天馬行空的創意變為現實,讓我們每個人都能自由的創造。 然後這位網友問了我一個問題: > 在整個工作流程中,你覺得最困難的部分是什麼? 這裡面最難的部分不是提示詞,甚至不是創意,但是你得知道AI的能力的邊界,熟練掌握模型什麼不是什麼,再在模型的能力範圍內和你的想法之間找到一個最佳的結合點。 就是限制這個城市天氣預報的例子,我在GPT-4o Image的時候就寫過類似的,因為它能夠生成很不錯的效果,但是它不能自己去獲取日期和天氣再去生成圖形,所以我得寫一個獲取天氣的API,把地圖GPTs,這就有了可玩性了。 所以當Gemini整合了nanobanana pro之後,我馬上就重新測試了這個想法,發現Gemini模型現在可以獲得當前日期和天氣然後生成圖像,那麼這個想法就可以很容易實現。 另外一個難點就是你的作品不應該只是單一的場景,不是只有作者自己為了展示自己的提示詞而不是多牛,而是應該讓讀者能參與其中,是一個提示詞模板是提示詞,每個人都可以結合自己的、場景興趣去嘗試,去修改,這也是很有挑戰的事情。例如像下面城市天氣的提示詞,每個人都可以測試自己的城市,不同的日期,甚至可以衍生出很多好玩的版本,例如穿越回,把過去的地方變成火星、虛擬的遊戲地址。

