AlphaZero

Algoritma RL generik dari DeepMind yang menguasai catur, shogi, dan Go dari nol (self-play). Mengalahkan Stockfish (catur), Elmo (shogi), AlphaGo Zero (Go).

AlphaZero

Definisi

AlphaZero adalah algoritma reinforcement learning generik dari DeepMind yang menguasai catur, shogi, dan Go dari NOL (self-play).

Pencapaian (Desember 2017)

GameLawanHasilTraining
CaturStockfish 828-0-724 jam
ShogiElmo90-2-82 jam
GoAlphaGo Zero89-118 jam

Signifikansi

Era Pasca