Reasoning — Penalaran

Kemampuan AI untuk melakukan **penalaran multi-langkah** — logika, matematika, causal reasoning, planning. Model reasoning (o1, DeepSeek-R1) meng-internalisasi chain-of-thought.

Reasoning model: o1 (OpenAI 2024), DeepSeek-R1 (2025), Claude 4.5 Sonnet, Gemini 2.5 Thinking. Teknik: internal CoT, search, test-time compute scaling.

June 21, 2026 1 min concepts

Also known as: penalaran

Reasoning

Definisi

Reasoning dalam konteks AI adalah kemampuan model untuk melakukan penalaran logis multi-langkah — bukan hanya menghasilkan teks, tapi benar-benar “berpikir” sebelum menjawab.

Era

Pre-2022 — Chain-of-thought prompting (manual)
2024 — OpenAI o1 (internal CoT, test-time compute)
2025 — Reasoning models menjadi mainstream (o3, Claude 4.5 Sonnet thinking, DeepSeek-R1, Gemini 2.5 Thinking)
2026 — Agentic reasoning + search + tools

Benchmark

MATH, GSM8K — matematika
MMLU — general knowledge
HumanEval, SWE-bench — coding
ARC-AGI — abstrak reasoning
AIME 2024/2025 — olympiad

Reasoning — Penalaran

Reasoning

Definisi

Era

Benchmark

Connected to

Not yet written

References