RT @zpysky1125:MiniMax M2 技术博客 3:为什么 M2 最终成为一款全注意力模型? 代表预备训练负责人孙昊海。(https://t…
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年10月29日 16:44
RT @zpysky1125:MiniMax M2 技术博客 3:为什么 M2 最终成为一款全注意力模型? 代表预备训练负责人孙昊海。(https://t…