Peluncuran DeepSeek-R1

DeepSeek (startup China) merilis R1 — model reasoning open-source yang kinerjanya mendekati o1 OpenAI dengan biaya training hanya $5-6M. Saham NVIDIA turun $600B sehari.

DeepSeek-R1: open-source reasoning model, GRPO algorithm, $5-6M training cost. Pesaing o1, o3-mini. Saham NVDA turun 17%, market cap hilang $600B dalam sehari.

Print

Peluncuran DeepSeek-R1

Ringkasan

Pada 20 Januari 2025, DeepSeek (startup AI asal Hangzhou, China) merilis DeepSeek-R1 — model reasoning open-source yang kinerjanya mendekati o1 OpenAI, dengan biaya training hanya $5-6 juta (bandingkan $100M+ untuk frontier model Barat).

Dampak Pasar

  • Saham NVIDIA turun 17% dalam sehari
  • Market cap hilang $600B+ (perusahaan publik terbesar dalam sehari)
  • Rasionalisasi: frontier AI tidak butuh GPU sebanyak yang diasumsikan
  • MoE + GRPO — efisien dari sisi compute

Arsitektur

  • MoE: 671B total parameters, 37B aktif per inference
  • GRPO (Group Relative Policy Optimization) — algoritma RL baru, lebih efisien dari PPO
  • Distilled variants: R1-Distill-Qwen, R1-Distill-Llama

Signifikansi

  1. Efisiensi > skala — paradigma baru
  2. Open-source competitive dengan proprietary — beda dari assumption sebelumnya
  3. China AI mampu menghasilkan frontier model
  4. Cost turun 100x dalam 1 tahun
  5. AI for All — startup kecil & negara berkembang bisa training frontier

Gelombang Berikut

Setelah DeepSeek-R1:

  • Open-source LLM dari China, Eropa, dan Global South melesat
  • Margin proprietary AI dipertanyakan
  • DeepSeek V3 (Desember 2024) — base model
  • DeepSeek V4 (2025) — multimodal
  • Reasoning models menjadi standar industri

DeepSeek-R1 adalah ‘iPhone moment’ kedua AI: bukti bahwa frontier AI tidak harus mahal.

Connected to

Not yet written

The following pages are referenced but don't exist yet — they'd make good future additions.

  • /concepts/reasoning

References

  1. Wikipedia

Type at least 2 characters to search.

Press to navigate, to open, esc to close.