Diffusion Model
Definisi
Diffusion model adalah kelas model generatif yang belajar membalik proses difusi — yaitu menambahkan noise secara bertahap ke gambar, lalu belajar menghilangkan noise untuk menghasilkan gambar baru.
Cara Kerja
- Forward process — tambahkan Gaussian noise secara bertahap ke gambar asli
- Reverse process — train neural network (U-Net atau Transformer) untuk memprediksi & menghilangkan noise
- Sampling — mulai dari random noise, denoise bertahap untuk menghasilkan gambar
Tonggak
- 2015 — Deep Unsupervised Learning using Nonequilibrium Thermodynamics (Sohl-Dickstein)
- 2020 — DDPM (Ho et al.)
- 2022 — Latent Diffusion Models (Rombach et al.) → Stable Diffusion
- 2022 — DALL-E 2, Imagen, Parti
- 2024 — Sora (video diffusion)