每当一个模型能够立即对一个非常复杂的代码审查问题做出反应时,我都会持怀疑态度。 当我看到这里显示的这种模式,即在一次回答中 10 次都自信地出错,嗯……这让我完全不相信它。
即使它表面上努力想要提出更谦逊、更正确的主张,最终也只是提出了一些无关紧要的、基本上又是错误的论点。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 2 条推文 · 2025年12月11日 12:31
每当一个模型能够立即对一个非常复杂的代码审查问题做出反应时,我都会持怀疑态度。 当我看到这里显示的这种模式,即在一次回答中 10 次都自信地出错,嗯……这让我完全不相信它。
即使它表面上努力想要提出更谦逊、更正确的主张,最终也只是提出了一些无关紧要的、基本上又是错误的论点。