When AI Builds Itself: Our progress toward recursive self-improvement
Anthropic délègue progressivement une part croissante du développement d'IA à des systèmes d'IA eux-mêmes, ce qui accélère leurs cycles de travail et ouvre la possibilité — non certaine — d'une amélioration récursive autonome. Des preuves publiques et internes montrent une accélération: horizons de tâche doublant tous les quelques mois, des benchmarks de codage et de recherche se saturant rapidement, et une part importante du code produit en interne (plus de 80 % des lignes mergées) attribuée à Claude, avec une productivité par ingénieur atteignant jusqu'à huit fois les niveaux antérieurs. Les agents Claude exécutent désormais des tâches complexes en autonomie (écriture et exécution de code, optimisation d'expériences et projets de recherche end-to-end), obtenant sur des tâches bien spécifiées des gains parfois supérieurs aux humains tandis que le jugement stratégique et le choix des priorités demeurent des points faibles relatifs. Trois trajectoires futures sont envisagées: un ralentissement et une diffusion large des capacités, des gains d'efficacité composés transformant le travail et les risques sociétaux, ou l'émergence d'une IA capable d'auto-amélioration récursive, chacune posant des contraintes et des incertitudes différentes, notamment sur l'alignement et le contrôle. Les auteurs proposent d'explorer des options de ralentissement ou de pause vérifiables à l'échelle internationale, d'investir dans des mécanismes de coordination et de vérification, et d'organiser des consultations rassemblant décideurs, chercheurs et société civile pour traiter ces questions.