Database Modernes & ML (2015–aujourd’hui)
Depuis 2015, le paysage des bases de données se recompose autour de trois tendances : NewSQL, cloud-native, et vector databases pour l’IA.
NewSQL — Google Spanner (2012, public 2017) est la première base relationnelle globalement distribuée avec une cohérence forte et une disponibilité élevée. CockroachDB (2015) clone Spanner en open source. TiDB (2015) propose un sharding auto-géré compatible MySQL.
Cloud-native — Snowflake (2014) sépare stockage et calcul, scale indépendamment. BigQuery, Redshift, Databricks transforment l’analyse de données en service serverless. Supabase (2020) réinvente Firebase avec PostgreSQL comme backend.
Vector databases — l’explosion des LLMs et embeddings (OpenAI, BERT, etc.) crée un besoin : stocker et rechercher des vecteurs à haute dimension. Pinecone (2019), Weaviate, Qdrant, Chroma (2023) émergent. PostgreSQL ajoute le support vectoriel via pgvector.
Pour ta thèse : Les systèmes distribués tolérants aux fautes byzantines ont besoin de stockage cohérent et résilient. Les architectures NewSQL (Spanner, CockroachDB) et les bases vectorielles distribuées sont pertinentes pour la gestion des gradients et des modèles dans l’apprentissage fédéré.
| Année | Contribution | Acteurs |
|---|---|---|
| 2012 | Spanner — première DB relationnelle globalement distribuée, TrueTime | |
| 2014 | Snowflake — séparation storage/calcul, cloud-native | Benoit Dageville, Thierry Cruanes |
| 2015 | CockroachDB — Spanner-like open source, distribution forte | Cockroach Labs |
| 2015 | TiDB — sharding auto-géré, compatible MySQL | PingCAP |
| 2019 | Pinecone — première base vectorielle managée | Pinecone (Edo Liberty) |
| 2021 | pgvector — support vectoriel dans PostgreSQL | Andrew Kane |
| 2023 | Chroma — base vectorielle open source, légère, pour l’IA | Chroma |
| 2023 | Neon — PostgreSQL serverless avec branchement natif | Neon (Nikita Shamgunov) |
← La Révolution NoSQL (2005–2015) • 04