#LLM
7 articles tagged with #LLM.
Chain-of-Thought (CoT) Teknik prompting di mana LLM diminta menunjukkan langkah penalaran sebelum jawaban akhir. Meningkatkan akurasi pada tugas reasoning (matematika, logika, multi-step). Emergent Behavior Kemampuan yang tidak diprogram secara eksplisit, muncul dari skala model + data. LLM menunjukkan emergent abilities pada skala tertentu (reasoning, in-context learning). Hallucination — Halusinasi AI Ketika AI menghasilkan informasi yang **kelihatannya benar tapi salah** — mengutip fakta, paper, atau sumber yang tidak ada. Masalah utama LLM. Mixture of Experts (MoE) Arsitektur neural network dengan beberapa 'expert' sub-network, di mana router memilih subset expert aktif per input. Efisien: lebih banyak parameter dengan FLOPs lebih sedikit. Prompt Engineering Disiplin merancang prompt (input) untuk LLM agar menghasilkan output yang diinginkan. Teknik: few-shot, chain-of-thought, role prompting, structured output. Reasoning — Penalaran Kemampuan AI untuk melakukan **penalaran multi-langkah** — logika, matematika, causal reasoning, planning. Model reasoning (o1, DeepSeek-R1) meng-internalisasi chain-of-thought. RLHF — Reinforcement Learning from Human Feedback Teknik alignment LLM dengan belajar dari preferensi manusia. Human ranker menilai beberapa output model, reward model dilatih, lalu policy di-optimize dengan RL.