正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年11月12日 下午6:01
RT @mike64_t:友情提醒,足夠規模的 LSTM 可以無限接近 MFU 的峰值,最終甚至超越 Flash Attention 演算法…