Attention Mechanism

Mekanisme neural network yang memungkinkan model fokus pada bagian input yang relevan saat menghasilkan output. Fondasi arsitektur Transformer.

Attention Mechanism

Definisi

Attention adalah mekanisme yang memungkinkan model neural network untuk fokus pada bagian input yang relevan saat menghasilkan output.

Tipe

Formula

Attention(Q, K, V) = softmax(QK^T / √d_k) V

Q (query), K (key), V (value) — bobot perhatian dihitung dari Q·K, lalu applied ke V.

Inovasi