彼らが1) ZAYAのように圧縮と潜在計算をより深く掘り下げ、2) スパース性を大幅に高め、MoEを完全に放棄し、スモールワールド回路を直接扱うか、UTのようなものを探求することを期待しています。V4ではなくても、次の論文ではそうなるでしょう。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
1 件のツイート · 2025/12/17 6:25
彼らが1) ZAYAのように圧縮と潜在計算をより深く掘り下げ、2) スパース性を大幅に高め、MoEを完全に放棄し、スモールワールド回路を直接扱うか、UTのようなものを探求することを期待しています。V4ではなくても、次の論文ではそうなるでしょう。