我的天!Gemini 3 Deep Think 甚至比 Gemini 3 Pro 性能还要好。 - 人类最后一次考试的得分为 41%。 - ARC-AGI-2 得分 45.1% 谷歌在Transformer发布后重夺人工智能领域的主导地位。这或许是一个时代的转折点。OpenAI能否迎头赶上?
所以 Grok 4.1 只排名第一一天……
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 2 条推文 · 2025年11月18日 16:16
我的天!Gemini 3 Deep Think 甚至比 Gemini 3 Pro 性能还要好。 - 人类最后一次考试的得分为 41%。 - ARC-AGI-2 得分 45.1% 谷歌在Transformer发布后重夺人工智能领域的主导地位。这或许是一个时代的转折点。OpenAI能否迎头赶上?
所以 Grok 4.1 只排名第一一天……