Paper 'Attention Is All You Need'

Makalah seminal dari Google Brain yang memperkenalkan arsitektur Transformer. Tidak menggunakan recurrence atau convolution, hanya attention mechanism. Mengubah sejarah AI.

Paper ‘Attention Is All You Need’

Ringkasan

Paper “Attention Is All You Need” yang diterbitkan di arXiv pada 12 Juni 2017 (NeurIPS 2017) memperkenalkan arsitektur Transformer yang sepenuhnya berdasarkan attention mechanism — tanpa recurrence atau convolution. Paper ini mengubah AI selamanya.

Penulis

Delapan peneliti dari Google Brain dan Google Research:

Inovasi

  1. Self-attention — setiap token melihat semua token lain
  2. Multi-head attention — beberapa attention paralel
  3. Positional encoding — informasi posisi ditambahkan
  4. Encoder-decoder architecture
  5. Fully parallelizable — tidak seperti RNN

Hasil

Paper mencapai SOTA di machine translation (WMT 2014 EN-DE, EN-FR) dengan lebih murah training dari model sebelumnya.

Dampak Jangka Panjang

Paper ini menjadi fondasi dari:

Pada 2026, paper ini menjadi makalah paling banyak dikutip dalam sejarah AI. Transformer adalah CPU of AI — arsitektur universal.