Rnj-1 的理念中蘊含著令人驚訝的意識形態層面,他們反對 DeepSeek 和 OpenAI 將產業重心轉向強化學習。他們的論點實際上是:“你還沒學會走路呢;把全部賭注都押在強化學習上是愚蠢的。” PI可以做RL。我想知道Essential會走向何方。
在我看來,Essential 與 DeepSeek 和 Prime Intellect 一樣,都屬於“意識形態實驗室”,它提出了自己獨特的、以原則為基礎的研究方案,旨在推進開放智能的發展。或許我們可以把 Arcee 也列入其中,名列第四,因為它們都專注於融合。 我為學校數量的增加感到高興。
我想 @Dorialexander 和 @pleiasfr 也應該算在內(小模型極大化,一種不同的強化學習方法)。還有 @ZyphraAI,他們的數學嚴謹性和演算法優化(被低估了)。我還漏掉了誰嗎?


