📜 Learning

Du perceptron aux transformers — l’histoire de l’apprentissage machine, des frameworks et des architectures.


Table des Chapitres

#ChapitreRésumé
01Les Fondations (1943–1986)Perceptron, backpropagation, hiver de l’IA — les débuts du ML
02L’essor des Réseaux (1989–2012)CNN, LSTM, ImageNet, AlexNet — la renaissance du deep learning
03Frameworks : La Guerre des MoteursTorch, Theano, TensorFlow, PyTorch, JAX — la guerre des frameworks
04L’Ère des TransformersAttention Is All You Need, BERT, GPT, ViT — l’architecture qui a tout changé
05Deep Learning DistribuéDDP, FSDP, DeepSpeed, Megatron — entraîner sur des milliers de GPU
06Écosystème ActuelLLMs, frameworks, hardware, agents — panorama de l’état de l’art
07Graph Neural Networks (GNNs)GCN, GAT, message passing — apprendre sur des graphes
08Hardware : La Révolution du CalculCUDA, GPU, TPU — le calcul qui a rendu le DL possible
09Optimisation : Évolution des OptimiseursSGD, Adam, AdamW, Lion — l’histoire des optimiseurs
10Normalisation & RégularisationBatchNorm, LayerNorm, Dropout — stabiliser l’entraînement
11Reinforcement LearningDQN, PPO, AlphaGo — apprendre par essai et récompense
12Modèles GénératifsGANs, VAE, Diffusion — générer à partir de bruit
13Vision par OrdinateurCNN, YOLO, ViT, SAM — voir et comprendre les images
14NLP : Du Word Embedding aux LLMsWord2Vec, BERT, GPT — comprendre et générer le langage
15AutoML & Meta-LearningNAS, HPO, few-shot — apprendre à apprendre
16Self-Supervised LearningSimCLR, MAE, CLIP — apprendre sans étiquettes
17Datasets FondamentauxMNIST, ImageNet, C4 — les données qui ont fait le ML
18Adversarial ML & RobustesseFGSM, PGD, adversarial training — attaquer et défendre
19Federated LearningFedAvg, non-IID, confidentialité — entraîner sans centraliser
20Attaques ByzantinesKrum, Bulyan, Median — le problème des généraux en ML
21Knowledge DistillationTeacher-student, soft targets — compresser le savoir
22Quantization & PruningINT8, FP4, élagage — rendre les modèles plus légers
23Continual LearningCatastrophic forgetting, replay — apprendre sans oublier
24Causal Machine LearningDoWhy, inférence causale — causes, pas corrélations
25Geometric Deep LearningManifolds, symmetries, GNNs — la géométrie du DL
26Bayesian Deep LearningIncertitude, priors, VI — le DL probabiliste
27Fonctions d’ActivationSigmoid, ReLU, GELU, SwiGLU — les non-linéarités
28Fonctions de LossCross-entropy, contrastive, triplet — mesurer l’erreur
29Mécanismes d’AttentionSelf-attention, multi-head, causal — le cœur des Transformers
30Positional EncodingsSinusoïdal, RoPE, ALiBi — dire où il est
31Scaling LawsKaplan, Chinchilla — la physique des LLMs
32Alignment (RLHF → DPO → ORPO)RLHF, DPO, ORPO — aligner avec les préférences
33Parameter-Efficient Fine-TuningLoRA, QLoRA, Adapter — fine-tuner sans tout ré-entraîner
34Mixture of Experts (MoE)Shazeer, Mixtral, DeepSeek — plus grand sans plus de calcul
35Hardware-Aware AlgorithmsFlashAttention, kernel fusion — algorithmes conscients du hardware
36Open Source AI MovementHugging Face, Llama, OLMo — la démocratisation de l’IA
37Differential PrivacyDP-SGD, PATE — protéger la vie privée
38Reproducibilité & Experiment TrackingSeed, logging, W&B — la science reproductible
39Datasets de Référence par DomaineVision, NLP, audio — les benchmarks par domaine
40Formal Verification & AI SafetySécurité, alignement, vérification — l’IA digne de confiance
41Hardware TimelineTPU, Groq, Cerebras — tableaux du hardware ML
42Liens avec la ThèseIntersection FL, Byzantine, distribué — le pont avec ta recherche
43Timeline VisuelleLigne du temps 1943–2026 — tout le ML en un coup d’œil

🔗 Voir aussi : Hardware, Distributed Systems, Python, Concepts avancés, Glossaire, Analyse de papiers