ちなみに、ビデオ生成とは異なり、世界モデルには「因果関係の理解」が必要です。 ビデオ生成モデルは、最初にテニス ボールの軌道を [暗黙的に] サンプリングし、次にそれに応じてプレーヤーの動きをサンプリングすることができます。 ワールド モデルではそれができないため、プレイヤーの動きが強制されます。
P(X|Y)P(Y) と P(Y|X)P(X) は、暗号ハッシュの計算と暗号ハッシュの解読と同じくらい異なる場合があります。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
2 件のツイート · 2025/12/08 16:09
ちなみに、ビデオ生成とは異なり、世界モデルには「因果関係の理解」が必要です。 ビデオ生成モデルは、最初にテニス ボールの軌道を [暗黙的に] サンプリングし、次にそれに応じてプレーヤーの動きをサンプリングすることができます。 ワールド モデルではそれができないため、プレイヤーの動きが強制されます。
P(X|Y)P(Y) と P(Y|X)P(X) は、暗号ハッシュの計算と暗号ハッシュの解読と同じくらい異なる場合があります。