AlphaZero

Algoritma RL generik dari DeepMind yang menguasai catur, shogi, dan Go dari nol (self-play). Mengalahkan Stockfish (catur), Elmo (shogi), AlphaGo Zero (Go).

AlphaZero: satu algoritma untuk 3 game. MCTS + deep neural network + self-play. Mengalahkan Stockfish 28-0, Elmo 90-2, AlphaGo Zero 89-11.

June 21, 2026 1 min concepts

AlphaZero

Definisi

AlphaZero adalah algoritma reinforcement learning generik dari DeepMind yang menguasai catur, shogi, dan Go dari NOL (self-play).

Pencapaian (Desember 2017)

Game	Lawan	Hasil	Training
Catur	Stockfish 8	28-0-72	4 jam
Shogi	Elmo	90-2-8	2 jam
Go	AlphaGo Zero	89-11	8 jam

Signifikansi

Single algorithm untuk 3 game berbeda
No human knowledge — hanya aturan game
Pendekatan generik — mendekati AGI
Master superhuman dalam hitungan jam

Era Pasca

MuZero (2019) — tanpa model aturan
AlphaProof (2024) — matematika olympiad
AlphaGeometry (2024) — geometri
OpenAI Five (2018) — Dota 2

AlphaZero

AlphaZero

Definisi

Pencapaian (Desember 2017)

Signifikansi

Era Pasca

Connected to

Not yet written

References