X (Twitter)

别听那些唱衰的人，Gemini 3 在各种编程任务中都表现出色。从 Web 应用的 UI 开发、Swift iOS 开发、Python 后端代码，到任何与 AI/ML 相关的任务，它都能轻松胜任。它非常强大，能够很好地遵循规则并有效利用各种工具。

似乎每当有新的前沿模型发布时，总会有一群想蹭热度的人抱怨它“令人失望”，说它没能满足他们的需求。通常你会发现，要么是他们的引导能力太差，要么是他们的任务本身就很愚蠢，根本不切实际。

当然也有例外，比如Llama4，任何试用过三分钟的人都会觉得它糟糕透顶。但人们也曾对GPT-5说过同样的话，结果却大错特错。这就像股市一样，持怀疑态度和逆向思维的人反而更容易获得关注。负面情绪往往能带来销量。

（至少对于编程而言）重要的是，对于那些已经熟练使用类似模型进行软件开发的人来说，该模型有多好，以及他们在尝试了几个小时各种真实的、现实世界的任务后，而不是在愚蠢的陷阱问题上，他们给出的合理意见。

要真正了解模型的稳定性和自主性，以及它所展现出的自主性和“毅力和决心”（其中一些也取决于代理框架，例如 Cursor 与 Gemini-CLI），以及它在工具使用方面的可靠性，都需要花费一些时间进行大量的独立试验。

来自 Jeffrey Emanuel（@doodlestein）的推文线程