别听那些唱衰的人,Gemini 3 在各种编程任务中都表现出色。从 Web 应用的 UI 开发、Swift iOS 开发、Python 后端代码,到任何与 AI/ML 相关的任务,它都能轻松胜任。它非常强大,能够很好地遵循规则并有效利用各种工具。
似乎每当有新的前沿模型发布时,总会有一群想蹭热度的人抱怨它“令人失望”,说它没能满足他们的需求。通常你会发现,要么是他们的引导能力太差,要么是他们的任务本身就很愚蠢,根本不切实际。
当然也有例外,比如Llama4,任何试用过三分钟的人都会觉得它糟糕透顶。但人们也曾对GPT-5说过同样的话,结果却大错特错。这就像股市一样,持怀疑态度和逆向思维的人反而更容易获得关注。负面情绪往往能带来销量。
(至少对于编程而言)重要的是,对于那些已经熟练使用类似模型进行软件开发的人来说,该模型有多好,以及他们在尝试了几个小时各种真实的、现实世界的任务后,而不是在愚蠢的陷阱问题上,他们给出的合理意见。
要真正了解模型的稳定性和自主性,以及它所展现出的自主性和“毅力和决心”(其中一些也取决于代理框架,例如 Cursor 与 Gemini-CLI),以及它在工具使用方面的可靠性,都需要花费一些时间进行大量的独立试验。