Peluncuran LLaMA (Meta)

Meta AI merilis LLaMA (Large Language Model Meta AI) — keluarga foundation model open-source 7B-65B parameter. Bocoran weights memicu ledakan open-source LLM.

LLaMA 1: 7B, 13B, 33B, 65B. Paper LLaMA: open-source-rival GPT-3. Bocoran weights Maret 2023 → torrent 4chan, didistribusikan luas. Memicu Alpaca, Vicuna, dll.

Print

Peluncuran LLaMA

Ringkasan

Meta AI merilis LLaMA (Large Language Model Meta AI) pada 24 Februari 2023 — keluarga foundation model open-source 7B-65B parameter. Paper LLaMA berjudul “LLaMA: Open and Efficient Foundation Language Models” mengklaim performa mendekati GPT-3 dengan parameter lebih kecil.

Model

  • LLaMA 7B — 6.7B parameters
  • LLaMA 13B — 13.0B parameters
  • LLaMA 33B — 32.5B parameters
  • LLaMA 65B — 65.2B parameters

Bocoran Maret 2023

LLaMA awalnya hanya untuk riset (permintaan), bukan commercial. Pada awal Maret 2023, weights bocor dan didistribusikan via torrent di 4chan. Dalam hitungan hari, LLaMA-7B ada di mana-mana:

  • Alpaca (Stanford) — fine-tune LLaMA-7B dengan instruksi
  • Vicuna (Berkeley + CMU + Stanford) — fine-tune dari ShareGPT
  • GPT4All (Nomic AI) — CPU-friendly
  • Koala (Berkeley)
  • WizardLM, Orca, OpenChat — komunitas
  • Hugging Face — host model

Dampak

  • Open-source LLM menjadi gerakan global
  • Demokratisasi AI — researcher, startup, negara berkembang bisa pakai frontier model
  • Meta AI menjadi alternatif OpenAI
  • July 2023 — LLaMA 2 dengan lisensi komersial
  • 2024 — LLaMA 3, Llama 4

LLaMA adalah kontribusi open-source paling penting untuk AI modern.

Connected to

Not yet written

The following pages are referenced but don't exist yet — they'd make good future additions.

  • /concepts/large-language-model
  • /sources/meta-ai

References

  1. Wikipedia

Type at least 2 characters to search.

Press to navigate, to open, esc to close.