Reasoning
Definisi
Reasoning dalam konteks AI adalah kemampuan model untuk melakukan penalaran logis multi-langkah — bukan hanya menghasilkan teks, tapi benar-benar “berpikir” sebelum menjawab.
Era
- Pre-2022 — Chain-of-thought prompting (manual)
- 2024 — OpenAI o1 (internal CoT, test-time compute)
- 2025 — Reasoning models menjadi mainstream (o3, Claude 4.5 Sonnet thinking, DeepSeek-R1, Gemini 2.5 Thinking)
- 2026 — Agentic reasoning + search + tools
Benchmark
- MATH, GSM8K — matematika
- MMLU — general knowledge
- HumanEval, SWE-bench — coding
- ARC-AGI — abstrak reasoning
- AIME 2024/2025 — olympiad