Attention Mechanism
Mekanisme neural network yang memungkinkan model fokus pada bagian input yang relevan saat menghasilkan output. Fondasi arsitektur Transformer.
From: LLM Wiki URL: llm-wiki.pages.dev/concepts/attention-mechanism Created: June 21, 2026 Updated: June 21, 2026 Read time: 1 min
Attention Mechanism
Definisi
Attention adalah mekanisme yang memungkinkan model neural network untuk fokus pada bagian input yang relevan saat menghasilkan output.
Tipe
- Bahdanau Attention (2014) — RNN-based translation
- Scaled Dot-Product Attention (Vaswani 2017) — fondasi Transformer
- Self-attention — attend ke input sendiri
- Cross-attention — attend ke input berbeda
- Multi-head attention — beberapa attention paralel
Attention(Q, K, V) = softmax(QK^T / √d_k) V
Q (query), K (key), V (value) — bobot perhatian dihitung dari Q·K, lalu applied ke V.
Inovasi
- Flash Attention (2022) — efisiensi memory
- Multi-Query Attention (MQA) (2019)
- Grouped-Query Attention (GQA) (2023)