Rnj-1 的理念中蕴含着令人惊讶的意识形态层面,他们反对 DeepSeek 和 OpenAI 将行业重心转向强化学习。他们的论点实际上是:“你还没学会走路呢;把全部赌注都押在强化学习上是愚蠢的。” PI可以做RL。我想知道Essential会走向何方。
在我看来,Essential 与 DeepSeek 和 Prime Intellect 一样,都属于“意识形态实验室”,它提出了自己独特的、以原则为基础的研究方案,旨在推进开放智能的发展。或许我们可以把 Arcee 也列入其中,位列第四,因为它们都专注于融合。 我为学校数量的增加感到高兴。
我想 @Dorialexander 和 @pleiasfr 也应该算在内(小模型极大化,一种不同的强化学习方法)。还有 @ZyphraAI,他们的数学严谨性和算法优化(被低估了)。我还漏掉了谁吗?


