ついにこんな本ができました!AI分野の第一線で活躍する研究者数名が協力し、普及モデルの原理を詳細に解説した論文を執筆しました。 バイリンガル版を翻訳しました。リンクは下にあります👇 これにより、現在の画像およびビデオ モデルの基礎的な普及モデルを非常に包括的に理解できるようになります。具体的には、次のようになります。 第 1 章: 生成モデルの定義、重要性、系統の概要を説明し、統一された理解の基盤を築きます。 第 2 章 (VAE の観点): 変分推論を使用して DDPM に接続し、潜在変数と再構成/ノイズ除去の目的を使用してトレーニングとサンプリングについて説明します。 第 3 章 (EBM/スコアの観点): エネルギー モデルから NCSN/スコア SDE まで、分数マッチングと連続時間 SDE を使用した生成ダイナミクスについて説明します。 第 4 章: サンプリングは時間に沿った ODE/SDE の逆解であり、拡散ドリフト ベクトル フィールドを使用してデータ分布を段階的に近似します。 第 5 章 (NF の観点): 正規化フローからフロー マッチングまで、可逆変換/フロー フィールド学習を通じて「時間の経過に伴う確率駆動型輸送」の考え方を統一します。 第 6 章: 微積分の置換公式を統一的な基礎として使用し、「条件付け手法」を使用して難しい問題を回帰に変換することで、安定した制御可能なトレーニングを実現します。 第 8 章: ODE フレームワーク内で DDIM と DPM ソルバーを再検討し、古典的な数値法との関係を明確にし、高速サンプリングの原理を説明します。 第 9 章: 忠実度と安定性を維持しながら反復サンプリングを高速化するための、体系化され最適化された数値積分とエラー制御。 第 10 章: 一貫性モデルなどの「フロー マッピング」アプローチを提案し、任意のタイム ステップから任意のタイム ステップへのデマッピングを直接学習して、より少ないステップでソリューションを生成します。 第 11 章: 一貫性のある軌道と平均フローを拡張して、1 ステップまたは非常に少ないステップで高品質の生成を行うための軌道全体 (積分) を学習します。
ファイルアpan.quark.cn/s/2a5100e32b518YvM3
