X (Twitter)

別聽那些唱衰的人，Gemini 3 在各種編程任務中都表現出色。從 Web 應用的 UI 開發、Swift iOS 開發、Python 後端程式碼，到任何與 AI/ML 相關的任務，它都能輕鬆勝任。它非常強大，能夠很好地遵循規則並有效利用各種工具。

似乎每當有新的前沿模型發佈時，總會有一群想蹭熱度的人抱怨它“令人失望”，說它沒能滿足他們的需求。通常你會發現，要嘛是他們的引導能力太差，要嘛是他們的任務本身就很愚蠢，根本不切實際。

當然也有例外，像是Llama4，任何試用過三分鐘的人都會覺得它糟糕透頂。但人們也曾對GPT-5說過同樣的話，結果卻大錯特錯。這就像股市一樣，持懷疑態度和逆向思考的人反而更容易獲得關注。負面情緒往往能帶來銷售。

（至少對於程式設計而言）重要的是，對於那些已經熟練使用類似模型進行軟體開發的人來說，該模型有多好，以及他們在嘗試了幾個小時各種真實的、現實世界的任務後，而不是在愚蠢的陷阱問題上，他們給出的合理意見。

要真正了解模型的穩定性和自主性，以及它所展現出的自主性和「毅力和決心」（其中一些也取決於代理框架，例如 Cursor 與 Gemini-CLI），以及它在工具使用方面的可靠性，都需要花費一些時間進行大量的獨立試驗。

來自 Jeffrey Emanuel（@doodlestein）的推文串