DeepSeek

Startup AI asal Hangzhou, China. Dikenal dengan model frontier open-source efisien: DeepSeek V2/V3, DeepSeek-R1. Biaya training $5-6M. Pelopor efisiensi AI.

DeepSeek: V2 (236B MoE, Mei 2024), V3 (671B MoE, Desember 2024), R1 (Januari 2025). Biaya training $5-6M. Pendorong efisiensi AI.

Print

DeepSeek

Profil

DeepSeek (深度求索) adalah perusahaan AI asal Hangzhou, China yang didirikan 2023 oleh Liang Wenfeng (juga pendiri High-Flyer, hedge fund kuantitatif). Dikenal dengan model frontier open-source yang sangat efisien.

Model

  • DeepSeek LLM (November 2023) — 67B
  • DeepSeek-Coder (2023) — code LLM
  • DeepSeek-V2 (Mei 2024) — 236B MoE
  • DeepSeek-V3 (Desember 2024) — 671B MoE
  • DeepSeek-R1 (Januari 2025) — reasoning
  • DeepSeek-V4 (2025) — multimodal

Efisiensi

  • Biaya training V3: $5-6M (vs $100M+ untuk frontier Barat)
  • MoE dengan aktivasi sparse
  • GRPO (Group Relative Policy Optimization) — algoritma RL baru
  • Multi-head Latent Attention (MLA) — efisiensi memory

Dampak

  • Saham NVDA turun 17% saat R1 rilis (Januari 2025)
  • Market cap hilang $600B dalam sehari
  • Rasionalisasi: frontier AI tidak butuh GPU sebanyak yang diasumsikan
  • Open-source sebagai gerakan mainstream

Makna

  • China AI mampu membuat frontier model
  • Efisiensi > skala
  • Startup kecil & negara berkembang bisa training frontier
  • Demokratisasi AI yang sebenarnya

Connected to

Not yet written

The following pages are referenced but don't exist yet — they'd make good future additions.

  • /concepts/moe
  • /timeline/peluncuruan-deepseek

References

  1. Wikipedia

Type at least 2 characters to search.

Press to navigate, to open, esc to close.