The Beautiful Future

Denoising Diffusion Probabilistic Models(DDPM) 본문

DNN/diffusion

Denoising Diffusion Probabilistic Models(DDPM)

Small Octopus 2023. 2. 28. 23:55

https://www.youtube.com/watch?v=_JQSMhqXw-4 

고려대학교 산업경영공학과 김정섭

text to image generation
EBMs Flow-based models GANs VAEs
DALL-E ( VAE 기반 활용, OpenAI January 2021 )
GLIDE ( diffusion, OpenAI December 2021 )
DALL-E 2 ( diffusion, OpenAI April 2022 )
Imagen ( diffusion, Google Brain May 2022 )

Diffusion 이란
물리 통계 동역학 Thermodynamics
Deep Unsupervised Learning using Nonequilibrium Thermodynamics ICML 2015. (시초)
Diffusion process

Markov Chain
Markov 성질: t+1 상태의 확률은 오직 t 의 상태에 의존한다.

Normalize Flow
MLP 기반 확률적 생성 모형, laten varialbe 기반 확률적 생성모형, z 획득에 변수 변환 공식을 활용
$ p_x(x) = p_z(z) \vert \frac{dz}{dx}  \vert $

Overview of generative models
GAN: Adversarial training
VAE: maximize variational lower bound
Flow-based models: Invertible transform of distributions
Diffusion models: Gradually add Gaussian noise and then reverse
반복적인 변화를 활용한다는 점에서 Flow-based models과 유사
분포에 대한 변분적 추론을 통한 학습을 진행한다는 점은 VAE와 유사
최근에 Diffusion 모델의 학습에 Adversarial training을 활용하기도 함 Diffusion-GAN 2022.

Laten variable model 
simple distribution(tractable gaussian) →complex distribution(visual/audio pattern)
결국 생성 모델로부터 원하는 것은 간단한 분포 z를 특정한 패턴을 갖는 분포로 변환(mapping, transformation, sampling)하는 것.

VAE

 

Comments