なぜ順方向KLを使用してデータ/モデルから分布を近似することを受け入れるのでしょうか(左の図)? (右の図) のようなアルゴリズムを目指してみませんか?それとも、分布全体ではなく、より最近のバイアスを使用して KL を最小化しているため、すでにそれを実行しているのでしょうか?