드디어 이런 책이 나왔네요! 여러 유명 AI 연구자들이 협력하여 확산 모델의 원리를 자세히 설명하는 논문을 발표했습니다. 저는 이중 언어 버전을 번역했습니다. 링크는 아래에 있습니다 👇 이를 통해 현재 이미지 및 비디오 모델의 기본 확산 모델을 매우 포괄적으로 이해할 수 있으며, 특히 다음 내용을 포함합니다. 1장: 생성 모델의 정의, 중요성, 계통에 대한 개요를 통해 통합된 이해의 기반을 마련합니다. 2장(VAE 관점): 변분 추론을 통한 DDPM 연결, 잠재 변수와 재구성/잡음 제거 목표를 사용한 학습 및 샘플링 설명. 3장(EBM/점수 관점): 에너지 모델에서 NCSN/점수 SDE까지, 분수 매칭과 연속 시간 SDE를 통한 생성 동역학을 설명합니다. 4장: 샘플링은 시간에 따른 ODE/SDE의 역해이고, 데이터 분포는 확산 드리프트 벡터장을 사용하여 단계적으로 근사화됩니다. 5장(NF 관점): 정규화된 흐름에서 흐름 매칭으로, 가역적 변환/흐름장 학습을 통해 "시간 경과에 따른 확률 기반 수송"이라는 개념을 통합합니다. 6장: 미적분학의 대입 공식을 통합된 기초로 사용하고, "조건화 기술"을 활용하여 어려운 문제를 회귀 문제로 변환함으로써 안정적이고 제어 가능한 학습을 달성합니다. 8장: ODE 프레임워크 내에서 DDIM과 DPM-Solver를 재검토하고, 고전적 수치적 방법과의 관계를 명확히 하며, 빠른 샘플링의 원리를 설명합니다. 9장: 반복 샘플링을 가속화하고 정확도와 안정성을 유지하기 위한 체계화되고 최적화된 수치적 적분과 오류 제어. 10장: 일관성 모델과 같은 "흐름 매핑" 접근 방식을 제안하여 모든 시간 단계에서 모든 시간 단계로의 디매핑을 직접 학습하여 더 적은 단계로 솔루션을 생성합니다. 11장: 일관된 궤적과 평균 흐름을 확장하여 1단계 또는 매우 적은 단계로 고품질 생성을 위한 전체 궤적(적분)을 학습합니다.
파일 주소pan.quark.cn/s/2a5100e32b51M3
