正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年11月12日 晚上7:02
黑色是標準的 15 億層 28 層模型,藍色是 arxiv 論文中的免費轉換器,計算和記憶體開銷增加了 3.5%,紅色和橙色是 v2 的兩個變體,開銷增加了 1.3%,程式碼也簡單得多。