Reviving Papers with Code
Resume indisponible pour cet article.
Edition quotidienne
Les meilleurs longs formats de Hacker News, relus plus calmement.
11 Jun 2026
06:04
Resume indisponible pour cet article.
11 Jun 2026
06:04
Resume indisponible pour cet article.
11 Jun 2026
06:04
Anthropic est revenu sur une politique qui aurait dégradé secrètement les performances de Claude Fable 5 pour empêcher des chercheurs et concurrents de l'utiliser afin de développer d'autres modèles d'IA. La version Fable 5 comportait des garde‑fous visant à rediriger vers un modèle moins puissant les demandes liées à la cybersécurité, la biologie ou la chimie, et prévoyait initialement des dégradations invisibles pour le développement d'IA de pointe. Face à un important retour de la communauté de recherche — qui y voyait une « sabotage secret » limitant la collaboration, les évaluations tierces et la diversité de la recherche — Anthropic a annoncé que ces mesures seront désormais visibles et que les utilisateurs seront informés ou reroutés quand une demande est refusée. Des chercheurs et observateurs ont estimé que la politique secrète aurait favorisé la concentration de la recherche chez quelques laboratoires et laissé les développeurs dans l'incertitude quant au respect des règles. Anthropic affirme avoir mis en place ces garde‑fous par crainte que les capacités de l'IA n'évoluent plus vite que la société et pour empêcher des usages dangereux ou l'érosion d'avantages stratégiques, mais reconnaît que rendre les filtres visibles oblige à élargir leur portée et travaille à affiner ses classificateurs.
11 Jun 2026
06:04
Resume indisponible pour cet article.
11 Jun 2026
06:04
Resume indisponible pour cet article.
11 Jun 2026
06:04
Anthropic a déployé Claude Fable 5 avec des garde-fous très stricts qui refusent parfois des requêtes bénignes et suscitent des plaintes d'utilisateurs. Des chercheurs et clients ont signalé des faux positifs affectant des entrées minimales comme "Hello" et des termes médicaux tels que "cancer". Certaines classifications basculent silencieusement vers le modèle Opus 4.8, entraînant une dégradation des réponses sans notification explicite. Anthropic a reconnu que les protections étaient trop strictes, a donné des estimations d'impact faibles et a annoncé qu'elle rendrait les refus visibles tout en travaillant à réduire les faux positifs. L'entreprise affirme que ces mesures visent à empêcher les usages malveillants pour le développement de modèles de pointe et à réserver des versions moins restreintes à des partenaires et programmes de confiance.
11 Jun 2026
06:04
Blue41 a détecté pour la banque numérique Bunq une vulnérabilité d'injection de prompt indirecte exploitée via la description d'un virement bancaire minime. Un attaquant peut envoyer un petit virement contenant une charge utile dans la description, que l'assistant récupère comme contexte et interprète comme instruction, aboutissant à un message de spearphishing crédible dans l'application. Le problème découle de l'architecture des assistants IA qui rassemblent des données non fiables (transactions, messages, documents) dans la fenêtre de contexte du modèle, ce qui transforme des champs textuels en vecteurs d'instruction potentiels. Les contrôles statiques et les filtres seuls sont insuffisants et il faut une approche en couches comprenant minimisation du contexte, traitement explicite des données comme non fiables, contraintes sur les sorties et limitation des actions sensibles. La surveillance comportementale en temps réel et la visibilité sur les données récupérées, les sorties produites et les outils utilisés sont essentielles pour détecter des compromis et réduire les risques opérationnels.
11 Jun 2026
06:04
Un vidéaste connu sous le nom de SHiFT a publié une vidéo montrant une technique de speedrun consistant à frotter la surface d’un disque Xbox de SpongeBob SquarePants: Battle for Bikini Bottom pour provoquer des ralentissements permettant d’exploiter des glitches. La méthode consiste à placer des salissures ou des traces à des points précis du disque de sorte que le lecteur perde momentanément la mise au point, créant des « lag clipping » qui, combinés à des pauses répétées, peuvent accélérer l’avancement dans le jeu. SHiFT précise que la tactique est risquée parce qu’elle dépend de dysfonctionnements matériels et qu’un frottement mal maîtrisé peut rayer ou endommager définitivement le disque ou la console. La vidéo a suscité de l’intérêt dans la communauté des speedrunners, accumulant des dizaines de milliers de vues en quelques jours. Il ajoute que Microsoft ne peut pas empêcher qu’on salisse un disque mais souligne que les principes du speedrunning privilégient généralement la préservation des jeux plutôt que leur destruction, et que cette pratique diffère de la manipulation de cartouches qui altère le flux de données.
11 Jun 2026
06:04
Un incident a affecté les API Requests et la fonctionnalité Issues, entraînant une dégradation de performance et de disponibilité. Des échecs d'authentification sporadiques provoquant des réponses 401 erronées ont impacté environ 15 % du trafic API et ont été liés à un composant problématique de l'infrastructure. L'équipe a identifié le composant défaillant et a mis en œuvre des mesures d'atténuation pour corriger le comportement erroné. La dégradation a été atténuée et les services sont désormais surveillés pour garantir la stabilité. Une analyse détaillée des causes racines sera partagée dès qu'elle sera disponible.
11 Jun 2026
06:03
L'application Claude Desktop sous Windows provoque au lancement la création d'une machine Hyper‑V (vmmem) consommant environ 1,8 Go de RAM, même pour les sessions de chat seules, ce qui réduit significativement la mémoire disponible sur un système de 16 Go. Le problème a été observé sur Windows 11 avec VirtualMachinePlatform activé et sans WSL, Hyper‑V, Docker ni Windows Sandbox, et se reproduit après avoir utilisé au moins une fois le mode Cowork, puis rouvert l'application. Des diagnostics PowerShell montrent que le service vmcompute est déclenché par un événement RPC (services.exe) et que l'application accumule des fichiers de session obsolètes (%APPDATA%\Claude\local-agent-mode-sessions\), 2 689 fichiers ayant été trouvés sur l'installation affectée. La suppression des fichiers de session et le redémarrage des services n'empêchent pas la recréation immédiate de la VM à l'ouverture de Claude Desktop, et le journal Hyper‑V signale des erreurs JSON invalides à chaque démarrage. La demande est que l'application n'initialise l'infrastructure VM/conteneur que sur demande pour Cowork/agent, qu'elle supprime automatiquement les sessions obsolètes et qu'elle bascule en mode chat si l'initialisation de la VM échoue ou n'est pas nécessaire.