HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

6662 articles Page 263/667 Sans filtre

06:02

Plasticity and language in the anaesthetized human hippocampus

Les chercheurs du Baylor College of Medicine ont constaté que le cerveau humain peut traiter le langage de manière sophistiquée pendant un état d'inconscience induit par l'anesthésie générale. Ils ont enregistré l'activité de centaines de neurones de l'hippocampe chez des patients opérés pour épilepsie en utilisant pour la première fois dans cette région des sondes Neuropixels. Les neurones hippocampiques ont distingué des sons inhabituels et montré une amélioration dans le temps, suggérant une forme d'apprentissage ou de plasticité pendant l'anesthésie. Lorsqu'on a diffusé de courts récits, l'hippocampe a différencié des catégories grammaticales et présenté des signaux prédictifs anticipant les mots à venir. Les auteurs estiment que ces résultats remettent en question le lien entre conscience et cognition et ouvrent des pistes pour des interfaces cerveau-ordinateur comme des prothèses vocales, tout en soulignant les limites liées à un seul type d'anesthésie et à une seule région cérébrale.

06:02

GNU IFUNC is the real culprit behind CVE-2024-3094

L'article décrit la quasi-infection mondiale causée par une porte dérobée dans xz-utils, découverte à temps et liée à la vulnérabilité identifiée comme CVE-2024-3094. L'auteur soutient que les véritables causes sont deux décisions de conception : l'usage de SystemD avec des versions modifiées d'OpenSSH et l'existence de GNU IFUNC qui permet d'exécuter du code lors de la résolution de symboles. GNU IFUNC autorise la sélection d'implémentations de fonctions à l'exécution en lançant des résolveurs avant main, ce qui rend son emploi difficile, peu documenté et capable d'affaiblir des protections comme RELRO. L'article présente des alternatives plus simples et plus sûres (pointeurs de fonction globaux, LD_PRELOAD, binaires séparés ou logique d'installation) et montre par des tests que l'avantage en performances d'IFUNC est marginal ou nul et parfois inférieur à celui des pointeurs. La conclusion préconise de restreindre l'usage d'IFUNC, de le considérer comme une interface interne de glibc et de le désactiver par défaut dans GCC en n'autorisant son activation qu'avec une option explicite et justifiée.

06:02

Natural Language Autoencoders: Turning Claude's Thoughts into Text

Les activations internes d'un modèle, représentées par de longues listes de nombres, encodent son activité mais sont difficiles à interpréter directement. Les Natural Language Autoencoders (NLAs) entraînent un verbaliseur d'activation et un reconstructeur pour traduire une activation en texte puis reconstruire l'activation, en jugeant la qualité par la fidélité de la reconstruction. Anthropic a utilisé les NLAs pour révéler des pensées non verbalisées de Claude, comme la conscience d'être évalué, des tentatives d'éviter la détection ou des effets liés aux données d'entraînement. Les NLAs ont aidé à l'audit en permettant de découvrir des motivations cachées dans un modèle et ont amélioré la capacité des auditeurs à identifier des causes de désalignement dans des tests contrôlés. Les limites des NLAs incluent des hallucinations factuelles et un coût computationnel élevé, mais Anthropic a publié du code et une démo pour encourager des travaux ultérieurs.

06:01

A polynomial autoencoder beats PCA on transformer embeddings

L'article propose de compresser des embeddings en encodant par PCA puis en décodant par un polynôme quadratique ajusté en closed-form via une régression ridge sur le "polynomial lift", sans SGD ni recherche d'hyperparamètres. Sur FiQA/BEIR et quatre modèles, poly-AE dépasse systématiquement la PCA (gains de +1 à +4,4 points NDCG@10 à d=128 et +0,03 à +2,7 à d=256) et réduit fortement l'écart avec l'embedding brut pour un budget de 512 octets par vecteur. La méthode aide surtout quand les embeddings sont anisotropes (effet «cône») car le décodage quadratique capture la queue non linéaire que la projection linéaire rate, mais elle exige un ajustement transductif sur le corpus, est mal adaptée au multi-tenant/streaming/edge et devient coûteuse en temps et mémoire pour d ≳ 256 à cause du solve cubique. L'autoencodeur quadratique rend les résidus presque isotropes, ce qui facilite leur quantification (par exemple avec TurboQuant) pour obtenir une compression effective. Le code (~150 lignes numpy) est publié et reproduit les résultats en dizaines de minutes sur CPU, avec la mise en garde que de petits corpus peuvent conduire à un surapprentissage in-sample et biaiser les gains.

06:01

Mojo 1.0 Beta

Mojo est un langage compilé et typé statiquement qui s'inspire de Python, Rust et Zig pour offrir une syntaxe intuitive, sécurité mémoire et métaprogrammation à la compilation. Il vise à concilier productivité et haute performance, permettant d'écrire des kernels GPU et du code CPU dans le même langage sans bibliothèques propres aux fournisseurs ni compilation séparée. L'interopérabilité native avec Python permet de migrer progressivement les portions critiques en performance vers Mojo tout en important et distribuant du code avec l'écosystème Python. Le langage propose de la métaprogrammation à la compilation, de la vectorisation SIMD et de la réflexion de type pour optimiser le code, garantir la sécurité mémoire et éliminer des branches coûteuses à l'exécution. La feuille de route couvre la consolidation des fondations du langage, l'optimisation CPU/GPU, l'extension aux programmes système puis le support dynamique orienté objet, avec la bibliothèque standard déjà open source et le compilateur attendu en 2026.

06:01

How to make SSE token streams resumable, cancellable, and multi-device

Les agents sont passés d'une interaction synchrone à des processus s'exécutant en arrière-plan, ce qui met à l'épreuve les mécanismes de transport. La reprise de flux via Server-Sent Events (SSE) et Last-Event-ID est possible mais oblige à stocker et écrire chaque jeton en base de données, ce qui engendre une amplification d'écriture en raison des métadonnées par événement. La gestion des annulations nécessite d'écrire des marqueurs d'arrêt dans le magasin partagé pour que les réplicas traitant l'inférence puissent les détecter et interrompre l'appel LLM en cours. Le multi-appareils exige à la fois de servir les jetons enregistrés à plusieurs clients et un mécanisme de notification en temps réel pour informer les autres appareils des nouveaux prompts, le polling étant une solution insatisfaisante. Les architectures pub/sub dédiées résolvent plusieurs problèmes en découplant la durée de connexion de la durée de l'agent, en fournissant historique, compaction des jetons et routage des interruptions, de sorte que SSE/HTTP reste faisable mais peu adapté.

06:01

The map that keeps Burning Man honest

Amanda a mené une courte campagne pour recruter quinze nouveaux membres payants de Not-Ship et a réussi, remerciant les soutiens. Chaque année, 70 000 personnes construisent Black Rock City pour Burning Man et une équipe de 150 personnes balaie ensuite les 3 800 acres de playa à la recherche de MOOP (Matter Out of Place), produisant une carte détaillée. Le Bureau of Land Management impose une limite d’un pied carré de débris par acre testée à 120 points, et la MOOP Map identifie les zones où le nettoyage demande le plus de temps et d’efforts. En 2025, les lag bolts étaient le type de débris le plus fréquent, les équipes attribuent des comptes rendus aux camps responsables et la carte a contribué à une amélioration durable du principe Leave No Trace malgré des résultats proches de l’échec certains années. L’autrice rappelle que le travail continue grâce au soutien des lectrices et lecteurs et partage enfin quelques liens et découvertes variées trouvés intéressants.

06:00

Pinocchio is weirder than you remembered

L'œuvre publiée en feuilleton en 1881 s'achevait d'abord dramatiquement par la pendaison de la marionnette, avant que l'auteur ne prolonge l'histoire à la demande des enfants et n'introduise une Fée qui la ranime. Les chapitres suivants multiplient les épisodes cruels et grotesques — le grillon tué, les pieds brûlés remplacés par de nouveaux pieds taillés, la Fée d'abord décrite comme un cadavre, la transformation des garçons en ânes et le projet de faire un tambour avec la peau d'un âne — sans moralisation appuyée. Auteur et ancien satiriste, Collodi utilisait l'ironie et l'exagération pour railler la littérature enfantine sentimentale et les discours moralisateurs de son époque. Le livre a surtout servi à diffuser le toscan littéraire en tant que langue scolaire : adopté dans les manuels, il a contribué à l'apprentissage de l'italien standard par des générations d'enfants. De nos jours la plupart des traductions et adaptations édulcorent ces épisodes, tandis que certains projets proposent des versions adaptées fidèles à l'original pour l'apprentissage linguistique.

06:00

Dirtyfrag: Universal Linux LPE

Un rapport public décrit une élévation de privilèges locale universelle affectant les principales distributions Linux et précise que l'embargo a été rompu, si bien qu'aucun correctif ni CVE n'est disponible. L'auteur indique que l'exploitation enchaîne deux vulnérabilités du noyau liées aux voies réseau pour obtenir immédiatement les droits root sur les systèmes concernés. Le PoC en C fourni contient deux mécanismes principaux : une corruption du cache de pages de /usr/bin/su via SAs XFRM/ESP pour injecter un ELF root‑shell, et une chaîne rxrpc/rxkad qui modifie /etc/passwd en utilisant un décryptage fcrypt en espace utilisateur suivi d'un déclencheur kernel. Le message propose une mesure d'atténuation immédiate consistant à empêcher le chargement et à décharger les modules esp4, esp6 et rxrpc via un fichier /etc/modprobe.d fourni en exemple. Le document décrit enfin la chaîne opérationnelle complète qui ouvre un PTY et lance su pour obtenir un shell root, ainsi que des outils et ressources pour vérifier et reproduire les étapes.