ImageNet 2012 — Kemenangan AlexNet

ImageNet Large Scale Visual Recognition Challenge 2012 dimenangkan AlexNet (Krizhevsky, Sutskever, Hinton) dengan margin 10,8% — memicu revolusi deep learning.

AlexNet: 8-layer CNN, ReLU, dropout, GPU training (2x NVIDIA GTX 580). Top-5 error 15,3% vs runner-up 26,2%. Tonggak era deep learning.

Print

ImageNet 2012 — Kemenangan AlexNet

Ringkasan

ImageNet Large Scale Visual Recognition Challenge (ILSVRC) 2012 dimenangkan oleh AlexNet (tim University of Toronto: Alex Krizhevsky, Ilya Sutskever, Geoffrey Hinton) dengan margin 10,8% atas runner-up.

Skor

  • AlexNet: Top-5 error 15,3%
  • Runner-up (ZXNet): Top-5 error 26,2%
  • Margin: 10,8% — terbesar dalam sejarah ILSVRC

Inovasi AlexNet

  • 8-layer CNN (5 conv + 3 FC) — sangat dalam untuk zamannya
  • ReLU activation — bukan tanh/sigmoid, training 6x lebih cepat
  • Dropout (Hinton et al.) — regularisasi
  • GPU training — 2x NVIDIA GTX 580
  • Data augmentation (flip, crop, PCA jitter)
  • Local Response Normalization

Mengapa Penting

Kemenangan AlexNet memicu:

  1. Industri AI mulai serius mengadopsi deep learning
  2. Penelitian berpindah dari SVM/shallow ke deep networks
  3. GPU computing menjadi standar untuk AI
  4. Startup boom 2013-2015 (DeepMind acquired Google $500M, dll)
  5. Era “deep learning” dimulai — berlangsung hingga sekarang

ImageNet

ImageNet adalah dataset 14 juta+ labeled images, 20.000+ kategori, diciptakan oleh Fei-Fei Li mulai 2009. ImageNet menjadi “ImageNet moment” — tonggak yang memicu revolusi.

Connected to

Not yet written

The following pages are referenced but don't exist yet — they'd make good future additions.

  • /concepts/convolutional-neural-network
  • /people/geoffrey-hinton

References

  1. Wikipedia

Type at least 2 characters to search.

Press to navigate, to open, esc to close.