Concepts Good

AlphaGo

Program Go yang dikembangkan DeepMind, mengalahkan Lee Sedol 4-1 pada 2016. Tonggak AI — Go dianggap game terakhir yang resisten terhadap AI.

AlphaGo: deep neural networks (policy + value) + Monte Carlo tree search + reinforcement learning. Pertama kalahkan manusia di Go.

June 21, 2026 1 min concepts

AlphaGo

Definisi

AlphaGo adalah program Go yang dikembangkan oleh DeepMind yang mengalahkan juara dunia Go Lee Sedol 4-1 pada Maret 2016. Tonggak AI.

Arsitektur

Policy network — prediksi move terbaik
Value network — evaluasi posisi
Monte Carlo Tree Search (MCTS) — search algorithm
Reinforcement learning — training dari self-play
Supervised learning dari data Go profesional

Pencapaian

Lee Sedol match (2016): 4-1
Ke Jie match (2017): 3-0
AlphaGo Zero (2017): belajar dari nol, lebih kuat
AlphaZero (2017): extend ke catur & shogi

Connected to

Not yet written

The following pages are referenced but don't exist yet — they'd make good future additions.

/concepts/reinforcement-learning
/timeline/peluncuran-alphago
/people/david-silver

References

Wikipedia