X (Twitter)

恕我直言，真正的高手在於反其道而行。 Frontier Labs唯一做對的只有基準測試和功能開發的時間表——也就是他們能夠掌控的事情。但這兩項並沒有像他們預測的那樣產生廣泛的影響。

值得思考的是，為什麼他們在所有無法直接掌控的事情上都犯了錯。多年來，我聽過無數內部人士（其中許多人我都很喜歡）激動人心的預測，但這些預測最終都與事實完全不符，哪怕是一點點都沒有。

所有現有證據，包括我親身使用模型的經驗，都顯示實驗室對自己提供的模型過於自信，你應該忽略任何沒有積極嘗試將LLM應用於企業軟體的實驗室。我知道這聽起來像是在為自己辯解…

……但是，忽略基準數據、激動人心的內部預測以及播客/帖子炒作，比認真對待這些東西要好得多。

說真的，你到底要看多少次社交媒體上因為“草莓”或“我剛看到一個東西，我們就要快速起飛了”之類的消息而瘋狂，然後一年後又是同樣的恐慌，而現實世界的進展卻非常緩慢而穩定，你還要繼續相信這些炒作嗎？

B2B市場告訴你，這些大多是假的，我們還有很長的路要走。我知道那些前沿實驗室的說法不一樣，但當然，在「給我激勵，我就能給你結果」的原則下，他們肯定會這麼說。

（我已經說了兩年同樣的話，但基本上沒人理會，而那些「我用了，但社會還沒準備好接受它」的人卻一直在這樣做，而且還得到了關注，所以我應該在2026年就放棄，讓大家都能享受其中的樂趣。）

記錄在案：

我認為 Frontier Labs 預測他們發布的數字會不斷上升並向右發展——他們利用每一個 IQ 點和 GPU 週期來達到這些數字——這是理所當然的，而與真正的商業和社會價值之間的聯繫則要復雜得多。

來自 Jon Stokes（@jon_stokes）的推文串