微軟反壟斷訴訟是網路泡沫破滅的幾個導火線之一。 針對 OpenAI/微軟/Google的具有里程碑意義的版權訴訟,將引發下一場訴訟的震盪。 這裡存在著巨大的風險:如果這些參與者中的任何一個不再被允許使用受版權保護的作品來訓練模型,這將開創一個先例,導致整個行業(包括 LLM、VLM、視頻模型、圖像模型等)的訓練數據經濟徹底崩潰……等等。 我們需要下一代人工智慧,它能夠真正地進行推理,並從分散資訊中創造新訊息,而不是僅僅成為一個重組式的查找引擎。 誠然,訓練資料始終是必需的,但我們需要能夠在較小的資料量基礎上利用運算能力,並獲得相對於輸入資料更大的收益。 你只需要取得一本小說的版權,就能讓人工智慧寫出 10 本小說,而不是需要購買 100 萬本小說的版權才能讓它寫出一本(而且寫的還是從 100 萬本小說中重組的詞語,而不是一本全新的絕版小說)。 利用免版稅資料進行預訓練可能仍會發揮一定作用,但這無疑改變了模型建構中大規模預訓練的範式。未來需要更加關注演算法本身。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。