Peluncuran DeepSeek-R1
Ringkasan
Pada 20 Januari 2025, DeepSeek (startup AI asal Hangzhou, China) merilis DeepSeek-R1 — model reasoning open-source yang kinerjanya mendekati o1 OpenAI, dengan biaya training hanya $5-6 juta (bandingkan $100M+ untuk frontier model Barat).
Dampak Pasar
- Saham NVIDIA turun 17% dalam sehari
- Market cap hilang $600B+ (perusahaan publik terbesar dalam sehari)
- Rasionalisasi: frontier AI tidak butuh GPU sebanyak yang diasumsikan
- MoE + GRPO — efisien dari sisi compute
Arsitektur
- MoE: 671B total parameters, 37B aktif per inference
- GRPO (Group Relative Policy Optimization) — algoritma RL baru, lebih efisien dari PPO
- Distilled variants: R1-Distill-Qwen, R1-Distill-Llama
Signifikansi
- Efisiensi > skala — paradigma baru
- Open-source competitive dengan proprietary — beda dari assumption sebelumnya
- China AI mampu menghasilkan frontier model
- Cost turun 100x dalam 1 tahun
- AI for All — startup kecil & negara berkembang bisa training frontier
Gelombang Berikut
Setelah DeepSeek-R1:
- Open-source LLM dari China, Eropa, dan Global South melesat
- Margin proprietary AI dipertanyakan
- DeepSeek V3 (Desember 2024) — base model
- DeepSeek V4 (2025) — multimodal
- Reasoning models menjadi standar industri
DeepSeek-R1 adalah ‘iPhone moment’ kedua AI: bukti bahwa frontier AI tidak harus mahal.