別聽那些唱衰的人,Gemini 3 在各種編程任務中都表現出色。從 Web 應用的 UI 開發、Swift iOS 開發、Python 後端程式碼,到任何與 AI/ML 相關的任務,它都能輕鬆勝任。它非常強大,能夠很好地遵循規則並有效利用各種工具。
似乎每當有新的前沿模型發佈時,總會有一群想蹭熱度的人抱怨它“令人失望”,說它沒能滿足他們的需求。通常你會發現,要嘛是他們的引導能力太差,要嘛是他們的任務本身就很愚蠢,根本不切實際。
當然也有例外,像是Llama4,任何試用過三分鐘的人都會覺得它糟糕透頂。但人們也曾對GPT-5說過同樣的話,結果卻大錯特錯。這就像股市一樣,持懷疑態度和逆向思考的人反而更容易獲得關注。負面情緒往往能帶來銷售。
(至少對於程式設計而言)重要的是,對於那些已經熟練使用類似模型進行軟體開發的人來說,該模型有多好,以及他們在嘗試了幾個小時各種真實的、現實世界的任務後,而不是在愚蠢的陷阱問題上,他們給出的合理意見。
要真正了解模型的穩定性和自主性,以及它所展現出的自主性和「毅力和決心」(其中一些也取決於代理框架,例如 Cursor 與 Gemini-CLI),以及它在工具使用方面的可靠性,都需要花費一些時間進行大量的獨立試驗。