ImageNet 2012 — Kemenangan AlexNet
Ringkasan
ImageNet Large Scale Visual Recognition Challenge (ILSVRC) 2012 dimenangkan oleh AlexNet (tim University of Toronto: Alex Krizhevsky, Ilya Sutskever, Geoffrey Hinton) dengan margin 10,8% atas runner-up.
Skor
- AlexNet: Top-5 error 15,3%
- Runner-up (ZXNet): Top-5 error 26,2%
- Margin: 10,8% — terbesar dalam sejarah ILSVRC
Inovasi AlexNet
- 8-layer CNN (5 conv + 3 FC) — sangat dalam untuk zamannya
- ReLU activation — bukan tanh/sigmoid, training 6x lebih cepat
- Dropout (Hinton et al.) — regularisasi
- GPU training — 2x NVIDIA GTX 580
- Data augmentation (flip, crop, PCA jitter)
- Local Response Normalization
Mengapa Penting
Kemenangan AlexNet memicu:
- Industri AI mulai serius mengadopsi deep learning
- Penelitian berpindah dari SVM/shallow ke deep networks
- GPU computing menjadi standar untuk AI
- Startup boom 2013-2015 (DeepMind acquired Google $500M, dll)
- Era “deep learning” dimulai — berlangsung hingga sekarang
ImageNet
ImageNet adalah dataset 14 juta+ labeled images, 20.000+ kategori, diciptakan oleh Fei-Fei Li mulai 2009. ImageNet menjadi “ImageNet moment” — tonggak yang memicu revolusi.