恕我直言,真正的高手在於反其道而行。 Frontier Labs唯一做對的只有基準測試和功能開發的時間表——也就是他們能夠掌控的事情。但這兩項並沒有像他們預測的那樣產生廣泛的影響。
值得思考的是,為什麼他們在所有無法直接掌控的事情上都犯了錯。多年來,我聽過無數內部人士(其中許多人我都很喜歡)激動人心的預測,但這些預測最終都與事實完全不符,哪怕是一點點都沒有。
所有現有證據,包括我親身使用模型的經驗,都顯示實驗室對自己提供的模型過於自信,你應該忽略任何沒有積極嘗試將LLM應用於企業軟體的實驗室。我知道這聽起來像是在為自己辯解…
……但是,忽略基準數據、激動人心的內部預測以及播客/帖子炒作,比認真對待這些東西要好得多。
說真的,你到底要看多少次社交媒體上因為“草莓”或“我剛看到一個東西,我們就要快速起飛了”之類的消息而瘋狂,然後一年後又是同樣的恐慌,而現實世界的進展卻非常緩慢而穩定,你還要繼續相信這些炒作嗎?
B2B市場告訴你,這些大多是假的,我們還有很長的路要走。我知道那些前沿實驗室的說法不一樣,但當然,在「給我激勵,我就能給你結果」的原則下,他們肯定會這麼說。
(我已經說了兩年同樣的話,但基本上沒人理會,而那些「我用了,但社會還沒準備好接受它」的人卻一直在這樣做,而且還得到了關注,所以我應該在2026年就放棄,讓大家都能享受其中的樂趣。)
記錄在案:
我認為 Frontier Labs 預測他們發布的數字會不斷上升並向右發展——他們利用每一個 IQ 點和 GPU 週期來達到這些數字——這是理所當然的,而與真正的商業和社會價值之間的聯繫則要復雜得多。