RT @classiclarryd:@varunneal 使用批量大小調度,創造了 NanoGPT 速通世界紀錄,用時 132 秒,峰值達到了驚人的 30 步/秒! …
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年12月9日 凌晨2:13
RT @classiclarryd:@varunneal 使用批量大小調度,創造了 NanoGPT 速通世界紀錄,用時 132 秒,峰值達到了驚人的 30 步/秒! …