Hallucination
Definisi
Hallucination adalah ketika model AI menghasilkan output yang kelihatannya koheren dan percaya diri tapi salah secara faktual — mengutip paper yang tidak ada, fakta yang tidak benar, atau reasoning yang keliru.
Jenis
- Intrinsic — output kontradiksi dengan input
- Extrinsic — output kontradiksi dengan dunia nyata
- Factuality hallucination — salah fakta
- Faithfulness hallucination — tidak sesuai prompt
Mitigasi
- RAG (Retrieval-Augmented Generation) — ambil dari sumber
- RLHF — belajar “tidak tahu”
- Self-consistency — sample banyak, vote
- Fact-checking tools
- Uncertainty estimation — model bilang “tidak yakin”
- Domain fine-tuning