Diffusion Model

Model generatif yang belajar membalik proses difusi — menambahkan noise ke gambar lalu belajar menghilangkannya. Fondasi Stable Diffusion, DALL-E 3, Imagen, Sora.

Diffusion model: forward (add noise) → reverse (denoise). DALL-E 2 (2022), Stable Diffusion (2022), Imagen (2022), Sora (2024). Latent diffusion lebih efisien (LDM).

Also known as: model difusi
Print

Diffusion Model

Definisi

Diffusion model adalah kelas model generatif yang belajar membalik proses difusi — yaitu menambahkan noise secara bertahap ke gambar, lalu belajar menghilangkan noise untuk menghasilkan gambar baru.

Cara Kerja

  1. Forward process — tambahkan Gaussian noise secara bertahap ke gambar asli
  2. Reverse process — train neural network (U-Net atau Transformer) untuk memprediksi & menghilangkan noise
  3. Sampling — mulai dari random noise, denoise bertahap untuk menghasilkan gambar

Tonggak

  • 2015 — Deep Unsupervised Learning using Nonequilibrium Thermodynamics (Sohl-Dickstein)
  • 2020 — DDPM (Ho et al.)
  • 2022 — Latent Diffusion Models (Rombach et al.) → Stable Diffusion
  • 2022 — DALL-E 2, Imagen, Parti
  • 2024 — Sora (video diffusion)

Connected to

Not yet written

The following pages are referenced but don't exist yet — they'd make good future additions.

  • /concepts/generative-ai

References

  1. Wikipedia

Type at least 2 characters to search.

Press to navigate, to open, esc to close.