Peluncuran OpenAI o1

OpenAI memperkenalkan o1 — LLM reasoning pertama yang 'berpikir' sebelum menjawab dengan chain-of-thought internal. Tonggak era reasoning models.

Peluncuran OpenAI o1

Ringkasan

OpenAI memperkenalkan o1 (dan o1-preview, o1-mini) pada 12 September 2024 — LLM reasoning pertama yang ‘berpikir’ sebelum menjawab menggunakan internal chain-of-thought yang di-train, bukan diminta.

Paradigma Baru

Sebelum o1, chain-of-thought adalah teknik prompting (user minta AI “show your work”). Dengan o1, CoT di-internalisasi ke model — model menghasilkan ribuan token reasoning secara internal sebelum menjawab user.

Pencapaian (saat peluncuran)

Varian

Test-Time Compute Scaling

o1 memperkenalkan test-time compute scaling — model yang ‘berpikir’ lebih lama menghasilkan jawaban lebih baik. Ini paralel dengan training compute scaling (Chinchilla, scaling laws).

Dampak

o1 menandai era reasoning models — 2024-2026.