推論中のもう 1 つの問題は、チャンク化による非スムーズな動きです。 モデルは次のチャンクを予測し、それを実行し、次のチャンクを予測するために一時停止します (下のビデオ、速度 3 倍)。 前のチャンクが実行される前にチャンクを予測しようとすると、モデルがまったく異なるアクション モードを実行している間に新しいアクション モードにジャンプすると、致命的なエラーが発生する可能性があります。 解決策は、画像生成でよく使われるインペインティングです。古いチャンクの実行中に次のチャンクを予測できますが、新しい予測が前のチャンクの末尾と完全に一致するように強制します。 その結果、ジャンプや一時停止のないよりスムーズな動作と、モデルのパフォーマンスとスループットが向上します。
完全な詳細(ビジュアル + デモ + 微調整手順付き)を知りたい場合は、私の新しいビデオをご覧ください: https://t.co/TDdhedJiDn