Self-Supervised Learning

Paradigma ML di mana label dibuat otomatis dari data itu sendiri (mis. masked word prediction, next sentence prediction). Fondasi LLM modern.

Self-supervised: create label from data. BERT (masked LM), GPT (next token), SimCLR (contrastive). Fondasi pre-training untuk LLM dan vision transformers.

Also known as: SSL, pembelajaran swa-diawasi
Print

Self-Supervised Learning

Definisi

Paradigma ML di mana label dibuat secara otomatis dari data itu sendiri — tidak butuh anotasi manusia.

Contoh

  • Masked Language Modeling (BERT) — prediksi kata yang disembunyikan
  • Next Token Prediction (GPT) — prediksi kata berikutnya
  • Contrastive Learning (SimCLR, CLIP) — representasi yang membedakan instance
  • Masked Image Modeling (MAE, BEiT)

Pentingnya

Self-supervised learning adalah fondasi revolusi LLM: model belajar dari triliunan token teks internet tanpa anotasi manual, lalu di-fine-tune untuk tugas spesifik.

Connected to

Not yet written

The following pages are referenced but don't exist yet — they'd make good future additions.

  • /concepts/machine-learning

References

  1. Wikipedia

Type at least 2 characters to search.

Press to navigate, to open, esc to close.