Open Source AI Movement
| Année | Jalon | Impact |
|---|---|---|
| 2015 | TensorFlow open source | Démocratisation du DL |
| 2016 | PyTorch open source + OpenAI Gym | Recherche accessible |
| 2017 | Hugging Face Transformers | API unifiée pour tous les modèles |
| 2020 | GPT-3 API (closed) | Début de la fracture open/closed |
| 2022 | Stable Diffusion (open) | Génératif open-source, bat les modèles closed |
| 2022 | BLOOM (1.4T tokens, 176B) | Premier LLM open-source multilingue |
| 2023 | Mistral 7B | Meilleur modèle pour sa taille, licence Apache 2.0 |
| 2024 | Llama 3 (8B, 70B, 405B) | Open rivalise avec closed (GPT-4 niveau) |
| 2024 | OLMo (AI2) | Entièrement ouvert : poids + data + code + recettes |
| 2024 | Pythia / DCLM (DataComp) | Recherche sur la qualité des données d’entraînement |
| 2025 | DeepSeek V3/R1 (open-weight) | MoE 671B + reasoning RL, rivalise avec GPT-5 |
| 2025 | Qwen 3.6 (Alibaba, Apache 2.0) | 100B+, reasoning natif, open-source compétitif |
| 2026 | DeepSeek V4 (open-weight) | 1.2T MoE, MLA v2, parité avec GPT-5.5 Pro |
| 2026 | Llama 4 Maverick (open) | MoE natif, 30T tokens, licences permissives |
| 2026 | Mistral Large 3 (open-weight) | 120B+, reasoning intégré, Apache 2.0 |
Impact pour la thèse : Ta librairie cible JMLR MLOSS — le standard open-source en ML. Les repos LPD-EPFL (ByzantineMomentum, ByzFL) sont en Apache 2.0.
← Hardware-Aware Algorithms • 39 • Differential Privacy →