Formal Verification & AI Safety

ApprocheAnnéeConcept
alpha-beta-CROWN2021Certification formelle de réseaux par bound propagation
Certified Robustness2019Entraîner avec des bornes certifiées (LiRPA, IBP)
Red Teaming2022Attaque systématique pour trouver des failles
Constitutional AI2023Régle interne auto-gérée (Anthropic)
RLHF (Alignment)2022Alignement par préférences humaines
Model Cards2018Documentation standardisée des modèles (Google)
Dataset Cards2020Documentation des jeux de données (Hugging Face)
Evaluations (MMLU, GSM8K, HumanEval)2021-2023Benchmarks de compétences
Watermarking LLM2023Détection de texte généré par IA
AI Act (EU)2024Législation européenne sur l’IA

← Datasets de Référence par Domaine43Hardware Timeline →