不過仔細想想,如果我設想的 Flash 模式要達到 16/3200 的專家級精度,那麼這些專家級精度就得非常低才行!我覺得這並非最佳方案。 另一方面:這篇關於迷因的論文,以及Qwen3-Next已經聘用瞭如此規模的專家這一事實(如果我的計算沒錯的話)。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年11月5日 晚上8:31
不過仔細想想,如果我設想的 Flash 模式要達到 16/3200 的專家級精度,那麼這些專家級精度就得非常低才行!我覺得這並非最佳方案。 另一方面:這篇關於迷因的論文,以及Qwen3-Next已經聘用瞭如此規模的專家這一事實(如果我的計算沒錯的話)。