強化学習は全く異なる世界です。上位9つのLLMは合計2.4Tトークン(約10TB)です。PufferLibは6x4090の小型マシン1台で1000TB以上の観測データを学習します。コンピューティングのスケーリングには多くの労力が費やされていますが、データのスケーリングにはほとんど労力が割かれていません。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
1 件のツイート · 2025/11/25 19:10
強化学習は全く異なる世界です。上位9つのLLMは合計2.4Tトークン(約10TB)です。PufferLibは6x4090の小型マシン1台で1000TB以上の観測データを学習します。コンピューティングのスケーリングには多くの労力が費やされていますが、データのスケーリングにはほとんど労力が割かれていません。