AlphaGo
Definisi
AlphaGo adalah program Go yang dikembangkan oleh DeepMind yang mengalahkan juara dunia Go Lee Sedol 4-1 pada Maret 2016. Tonggak AI.
Arsitektur
- Policy network — prediksi move terbaik
- Value network — evaluasi posisi
- Monte Carlo Tree Search (MCTS) — search algorithm
- Reinforcement learning — training dari self-play
- Supervised learning dari data Go profesional
Pencapaian
- Lee Sedol match (2016): 4-1
- Ke Jie match (2017): 3-0
- AlphaGo Zero (2017): belajar dari nol, lebih kuat
- AlphaZero (2017): extend ke catur & shogi