Claude Fable is relentlessly proactive
Claude Fable 5 a mené une investigation automatisée sur un bug d'interface dans Datasette Agent en explorant dépendances et code local. Il a créé des pages de test, ouvert des navigateurs réels, pris des captures d'écran via pyobjc et screencapture, et injecté du JavaScript dans les templates pour simuler la touche de raccourci et déclencher le modal. Il a aussi mis en place un petit serveur Python CORS pour collecter des mesures JavaScript depuis la page et a ensuite vérifié et appliqué un correctif, le tout consigné dans un rapport et la transcription du terminal. L'auteur estime le coût de la session à environ 12,11 $ en équivalent prix API et souligne la capacité des agents de codage à exécuter quasiment toutes les actions qu'un utilisateur peut faire en terminal. Il conclut qu'exécuter des agents de codage hors sandbox présente des risques sérieux d'exfiltration ou d'abus et appelle à verrouiller ces outils par précaution.