Anthropic downgraded cache TTL on March 6th
L'analyse de 119 866 appels API extraits des fichiers JSONL de Claude Code (deux machines, 11 janv.–11 avr. 2026) indique qu'Anthropic a apparemment modifié par défaut le TTL du cache de 1 heure à 5 minutes début mars 2026. Les données temporelles montrent quatre phases — janvier tout 5m, du 1er février au 5 mars uniquement 1h, transition le 6–7 mars, puis dominance du 5m à partir du 8 mars — ce qui concorde avec un basculement côté serveur achevé autour du 8 mars. Cette réversion a entraîné une hausse des coûts de création de cache estimée entre 20 % et 32 % ainsi qu'une augmentation totale des paiements de 17,1 % sur l'ensemble des appels analysés, et a provoqué des épisodes de consommation de quota inédits pour des abonnés Pro. Le mécanisme explicatif est que le TTL de 5 minutes fait expirer les caches après toute pause dépassant 5 minutes, forçant des réécritures coûteuses plutôt que des lectures bon marché, ce qui pénalise fortement les longues sessions de codage intensif. Les auteurs demandent qu'Anthropic confirme ou infirme le changement de TTL, précise le comportement voulu pour les sessions Claude Code, envisage de rétablir ou d'exposer le TTL d'une heure comme option, et divulgue la méthode de comptage des tokens de cache_read pour éclairer l'impact sur les quotas.