Reinforcement Learning (RL)

Paradigma machine learning di mana agen belajar dengan berinteraksi dengan environment, menerima reward atau punishment. AlphaGo, RLHF untuk LLM.

Reinforcement Learning

Definisi

Reinforcement learning (RL) adalah paradigma ML di mana agen belajar dengan berinteraksi dengan environment, menerima reward atau punishment.

Komponen

Algoritma

Aplikasi