正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年11月20日 下午2:08
這是一個很棒的帖子,其中包含一些基本的推理數學知識,有助於討論訓練 MoE 模型(相對而言)的可操作性。 我認為,除了本地使用之外,對於其他所有應用,MoE 顯然更勝一籌。