X (Twitter)

Beffの手法がモデルの学習を加速させる仕組みが全く理解できません。確かに、熱力学的ノイズから非常に安価なサンプリングを行うのは分かります。しかし、それがEBMを学習させて実際のデータ多様体を近似させるのにどのように役立つのでしょうか？本当に役立つのでしょうか？それとも、単なる推論のためのトリックなのでしょうか？論文の詳細は私には理解できない

Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)（@teortaxesTex）のスレッド

作者情報

スレッド内容