La Révolution GPU (2006–2015)
En 2006, NVIDIA lance CUDA (Compute Unified Device Architecture) — une plateforme qui permet d’utiliser les GPU pour du calcul généraliste, pas seulement pour le rendu graphique. Le GPGPU est né.
Les GPU sont massivement parallèles : des centaines de cœurs simples, idéaux pour les opérations matricielles qui sous-tendent le deep learning. En 2009, Andrew Ng (Stanford) montre qu’un GPU NVIDIA peut entraîner un réseau de neurones 100× plus vite qu’un CPU.
En 2012, AlexNet utilise deux GTX 580 pour pulvériser le benchmark ImageNet. C’est la preuve : GPU + deep learning = révolution. NVIDIA pivote : de fabricant de cartes graphiques pour joueurs, elle devient la société d’infrastructure de l’IA.
Tesla K10 (2012) puis K80 (2014) sont des GPU dédiés au calcul scientifique. NVIDIA Tesla P100 (2016, architecture Pascal) introduit les cœurs doubles précision et le NVLink pour interconnecter les GPU.
Pendant ce temps, AMD reste compétitif sur le gaming mais rate le virage ML. Intel continue d’optimiser les CPU pour le calcul vectoriel (AVX, AVX-512) mais ne peut pas rivaliser en parallélisme massif.
« NVIDIA didn’t predict deep learning. They built a tool for graphics, and AI happened to need exactly that tool. »
🔗 Voir aussi : History of Learning — le GPU est le moteur de la révolution deep learning.
| Année | Contribution | Acteurs |
|---|---|---|
| 2006 | CUDA — plateforme GPGPU, calcul généraliste sur GPU | NVIDIA |
| 2007 | Tesla C870 — premier GPU dédié au calcul (GPGPU) | NVIDIA |
| 2012 | AlexNet (2× GTX 580) — deep learning prouvé sur GPU | Krizhevsky, Sutskever, Hinton |
| 2014 | NVIDIA K80 — dual-GPU, 24 GB VRAM, calcul haute performance | NVIDIA |
| 2015 | AMD FirePro S9170 — dernier effort AMD pour le calcul ML | AMD |
← L’Ère des CPU (1971–2005) • 02 • L’Explosion ML →