“公司數量遠遠多於創意。” 計算量夠大,你很難看出是否需要更多的計算量來證明某個想法。 AlexNet 是用 2 個 GPU 建構的,而 Transformer 模型則用了 8 到 64 個 GPU。這相當於今天的 2 個 GPU 嗎?你可能會說,O1 推理並不是世界上計算量最大的任務。 對科研而言,你絕對需要一定程度的運算能力,但你是否需要絕對最多的運算能力,這一點遠非顯而易見。 如果大家都遵循相同的範式,那麼運算能力就成了重要的差異化因素之一。 @ilyasut
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。