@Clashluke の HeavyBall の Muon は PyTorch の Muon を上回りました。数値的に同等のバージョンを 150 行未満で実装しました。cpp バージョンもあります!最新の PufferLib 4 開発ブランチに含まれています。リポジトリにスターを付けて、Puffer にフィードしてください!
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
1 件のツイート · 2025/11/18 21:20
@Clashluke の HeavyBall の Muon は PyTorch の Muon を上回りました。数値的に同等のバージョンを 150 行未満で実装しました。cpp バージョンもあります!最新の PufferLib 4 開発ブランチに含まれています。リポジトリにスターを付けて、Puffer にフィードしてください!