Database Modernes & ML (2015–aujourd’hui)

Depuis 2015, le paysage des bases de données se recompose autour de trois tendances : NewSQL, cloud-native, et vector databases pour l’IA.

NewSQL — Google Spanner (2012, public 2017) est la première base relationnelle globalement distribuée avec une cohérence forte et une disponibilité élevée. CockroachDB (2015) clone Spanner en open source. TiDB (2015) propose un sharding auto-géré compatible MySQL.

Cloud-native — Snowflake (2014) sépare stockage et calcul, scale indépendamment. BigQuery, Redshift, Databricks transforment l’analyse de données en service serverless. Supabase (2020) réinvente Firebase avec PostgreSQL comme backend.

Vector databases — l’explosion des LLMs et embeddings (OpenAI, BERT, etc.) crée un besoin : stocker et rechercher des vecteurs à haute dimension. Pinecone (2019), Weaviate, Qdrant, Chroma (2023) émergent. PostgreSQL ajoute le support vectoriel via pgvector.

Pour ta thèse : Les systèmes distribués tolérants aux fautes byzantines ont besoin de stockage cohérent et résilient. Les architectures NewSQL (Spanner, CockroachDB) et les bases vectorielles distribuées sont pertinentes pour la gestion des gradients et des modèles dans l’apprentissage fédéré.

Année	Contribution	Acteurs
2012	Spanner — première DB relationnelle globalement distribuée, TrueTime	Google
2014	Snowflake — séparation storage/calcul, cloud-native	Benoit Dageville, Thierry Cruanes
2015	CockroachDB — Spanner-like open source, distribution forte	Cockroach Labs
2015	TiDB — sharding auto-géré, compatible MySQL	PingCAP
2019	Pinecone — première base vectorielle managée	Pinecone (Edo Liberty)
2021	pgvector — support vectoriel dans PostgreSQL	Andrew Kane
2023	Chroma — base vectorielle open source, légère, pour l’IA	Chroma
2023	Neon — PostgreSQL serverless avec branchement natif	Neon (Nikita Shamgunov)

← La Révolution NoSQL (2005–2015) • 04

ArtNotes

Explorateur

04 - Databases Modernes et ML (2015–aujourd'hui)

Database Modernes & ML (2015–aujourd’hui)

Vue Graphique

Liens retour