AlphaGo

Program Go yang dikembangkan DeepMind, mengalahkan Lee Sedol 4-1 pada 2016. Tonggak AI — Go dianggap game terakhir yang resisten terhadap AI.

AlphaGo: deep neural networks (policy + value) + Monte Carlo tree search + reinforcement learning. Pertama kalahkan manusia di Go.

Print

AlphaGo

Definisi

AlphaGo adalah program Go yang dikembangkan oleh DeepMind yang mengalahkan juara dunia Go Lee Sedol 4-1 pada Maret 2016. Tonggak AI.

Arsitektur

  • Policy network — prediksi move terbaik
  • Value network — evaluasi posisi
  • Monte Carlo Tree Search (MCTS) — search algorithm
  • Reinforcement learning — training dari self-play
  • Supervised learning dari data Go profesional

Pencapaian

  • Lee Sedol match (2016): 4-1
  • Ke Jie match (2017): 3-0
  • AlphaGo Zero (2017): belajar dari nol, lebih kuat
  • AlphaZero (2017): extend ke catur & shogi

Connected to

Not yet written

The following pages are referenced but don't exist yet — they'd make good future additions.

  • /concepts/reinforcement-learning
  • /timeline/peluncuran-alphago
  • /people/david-silver

References

  1. Wikipedia

Type at least 2 characters to search.

Press to navigate, to open, esc to close.