HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

3464 articles Page 1/347 Sans filtre

06:08

Hear your agent suffer through your code

Ce plugin s'exécute en parallèle d'un agent de codage et diffuse en temps réel des gémissements humains enregistrés qui augmentent lorsque le code lu paraît de plus en plus problématique. L'installation du plugin ne l'active pas automatiquement dans chaque fil, il faut démarrer un nouveau fil et demander à l'agent d'utiliser le plugin. Pour l'installer, on clone le dépôt et on l'ajoute comme marketplace local puis on installe via l'interface de Codex Desktop, le Codex CLI, le Claude CLI ou Cursor, en redémarrant l'application si nécessaire. Un script de test inclus permet de lister et de jouer des sons de gémissements avec des commandes Python fournies pour vérifier les fichiers audio. Le plugin nécessite Python 3.10+ et un lecteur audio local (afplay, paplay, aplay ou ffplay) et, en l'absence de lecteur, il affichera les résultats d'analyse sans jouer de sons.

06:08

Mounting tar archives as a filesystem in WebAssembly

Beaucoup de données sont distribuées en tar.gz et l'extraction complète exige de télécharger, décompresser et copier les fichiers, ce qui est coûteux en mémoire. L'approche consiste à générer un fichier d'index JSON listant pour chaque fichier ses offsets et tailles dans l'archive tar, puis à monter l'archive décompressée via WORKERFS d'Emscripten pour un accès sans copie. Le paquet npm tar-vfs-index crée cet index et précise que les champs start et end sont des offsets dans les octets du tar décompressé, et il peut aussi ajouter l'index à la fin de l'archive pour obtenir un fichier autonome. Le montage en pratique requiert de décompresser le .tar.gz avec DecompressionStream dans le navigateur, de charger le JSON d'index puis d'appeler FS.mount(WORKERFS, {packages: [{metadata, blob}]}, '/pkg') pour que les lectures C soient servies par découpage du Blob. Cette méthode exploite la disposition plate des tar, le slicing de WORKERFS et le gunzip natif du navigateur pour éviter les copies inutiles et améliorer sensiblement le temps et la mémoire nécessaires au chargement des paquets R dans WebR.

06:07

ML supports existence of unrecognized transient astronomical phenomena

Les auteurs étudient des sources ponctuelles transitoires qui apparaissent et disparaissent rapidement sur des plaques astronomiques historiques antérieures au lancement de Sputnik. Ils traitent le débat affirmant que ces transients seraient des défauts de plaque en développant un modèle d'apprentissage automatique entraîné sur 250 paires d'images annotées par des experts. Le modèle a montré une bonne discrimination (AUC = 0,81) avec une sensibilité et une spécificité de 0,71 et a été appliqué à 107 875 transients pour leur attribuer une probabilité d'être réels. Après contrôle des artefacts identifiés par le modèle, les auteurs rapportent une augmentation significative du nombre de transients autour des essais nucléaires (p = 0,024), une association plus forte pour les transients à haute probabilité (p < 0,0001) et un déficit marqué dans l'ombre terrestre (p < 0,0001), plus prononcé pour les transients à haute probabilité que pour les autres (p = 0,003). Les résultats appuient l'existence probable d'une population non reconnue d'objets transitoires sur les plaques historiques et justifient des investigations supplémentaires.

06:07

Redesigning the Recurse Center application to inspire curious programmers

L'équipe de RC a repensé son formulaire de candidature en s'inspirant des examens d'Oxford All Souls pour mieux éveiller la curiosité des candidats. La nouvelle version propose un ensemble de questions dont il faut en choisir deux, avec des exemples concrets allant du récit d'un bug étrange à la comparaison entre code et littérature. Ils ont aussi ajouté une question sur le projet de programmation dont le candidat est le plus fier et adapté l'invite pour partager un programme créé de toutes pièces. L'équipe souligne que de meilleures questions aident à repérer la curiosité et l'autonomie des candidats et rendent le processus plus engageant pour les deux parties. Ils donnent des conseils pratiques pour concevoir des candidatures efficaces, notamment publier une grille d'évaluation, inclure des questions qualitatives, éviter un formulaire trop long et prévoir des moyens de repérer les réponses générées par des modèles.

06:07

OpenAI releases GPT-5.5 and GPT-5.5 Pro in the API

En avril 2026, OpenAI a publié GPT-5.5 et une variante pro offrant une fenêtre contextuelle d'un million de tokens, prise en charge d'images, sorties structurées, appel de fonctions, mise en cache d'invite étendue et divers outils pour les travaux professionnels complexes. GPT Image 2 est arrivé pour la génération et l'édition d'images haute fidélité avec tailles flexibles, tarification au token et support Batch à tarif réduit, tandis que l'API Sora a été enrichie pour la vidéo avec références de personnages, générations plus longues et 1080p. Les séries GPT-5.4, 5.3 et 5.2 ont introduit des variantes mini et nano, améliorations de raisonnement et d'efficacité, ainsi que fonctionnalités comme Tool Search, Compaction et Built-in Computer pour les workflows d'agents. L'API Responses et l'Agents SDK ont été étendues avec des fonctionnalités d'orchestration d'agents, phase commentary/final_answer, Skills, Hosted Shell, exécution en sandbox, gestion des mémoires, WebSocket et connecteurs vers services externes. Des mises à jour transversales incluent optimisations de performance, priorisation de traitement, support audio et temps réel, outils de fine-tuning, compaction côté client, et fonctions de sécurité et gouvernance comme EKM et listes d'autorisation IP.

06:07

Different language models learn similar number representations

Les modèles de langage entraînés sur du texte naturel représentent les nombres à l'aide de caractéristiques périodiques présentant des pics dominants aux périodes T=2, 5 et 10. Nous identifions une hiérarchie à deux niveaux: si Transformers, RNN linéaires, LSTM et embeddings apprennent tous des pics de période-T dans le domaine de Fourier, seuls certains acquièrent des caractéristiques géométriquement séparables permettant de classifier linéairement un nombre modulo T. Nous démontrons que la parcimonie dans le domaine de Fourier est nécessaire mais pas suffisante pour obtenir une séparabilité géométrique mod-T. Empiriquement, la présence de séparabilité géométrique dépend des données, de l'architecture, de l'optimiseur et du tokenizer, et se développe via deux voies distinctes: des signaux de cooccurrence dans le langage (cooccurrence texte-nombre et interactions entre nombres) ou des problèmes d'addition multi-tokens. Ces résultats soulignent une évolution convergente dans l'apprentissage de caractéristiques: une diversité de modèles acquiert des caractéristiques analogues à partir de signaux d'entraînement différents.

06:07

CSS as a Query Language

L'article explore l'idée d'utiliser CSS comme langage de requête ou même de programmation générale, au-delà du simple rendu de pages web. Il rappelle les principes de base de CSS : des sélecteurs décrivent des ensembles d'éléments et des déclarations appliquent des propriétés, mais ces propriétés ne peuvent pas être interrogées pour influencer d'autres sélecteurs. Le texte propose un concept appelé CSSLog dans lequel les règles peuvent modifier l'état du DOM (par exemple ajouter des classes), provoquer l'activation d'autres règles et s'exécuter récursivement jusqu'à atteindre un point fixe, ce qui permettrait d'exprimer proprement des cas comme la propagation transitive d'un état «effectively-dark» interrompue par des bornes explicites. L'auteur établit une analogie avec Datalog en montrant que les règles logiques dérivent de nouveaux faits par itération jusqu'à un fixpoint selon une évaluation naïve et que la monotonicité garantit la terminaison, rapprochant ainsi la sémantique des règles logiques de celle des sélecteurs CSS. Il conclut que, malgré les limites pratiques et les précautions des navigateurs pour éviter des boucles infinies (comme dans les container queries), une piste intéressante serait de superposer une syntaxe CSS sur un moteur Datalog adapté aux données arborescentes pour obtenir un langage récursif et ergonomique pour les requêtes et transformations.

06:07

Devin for Terminal

L'installation se lance depuis le terminal avec une commande curl qui peut mettre à niveau vers le cloud en quelques secondes. L'outil permet de travailler localement puis de basculer automatiquement vers un agent cloud offrant des sessions parallèles. L'agent cloud fournit une machine virtuelle dédiée, des outils de test, des enregistrements vidéo et des fonctions d'autocorrection. Il intègre plusieurs modèles de pointe au même endroit pour couvrir différents besoins de traitement. L'application est écrite en Rust et conçue pour être très performante, illustrée par une démonstration sur le terminal VT100 original.

06:06

SFO Quiet Airport (2025)

L'aéroport de San Francisco a mis en place depuis 2018 une politique de calme visant à limiter les annonces, le bruit de fond et la musique commerciale, et a accéléré ce projet pendant la pandémie. Les mesures incluent la limitation des annonces aux portes et à leurs alentours, la centralisation des messages avec les compagnies aériennes, une réduction d'environ 40 % du paging en 2020 et la suppression de plus de 90 minutes d'annonces inutiles par jour dans le terminal international. D'autres aéroports internationaux comme Amsterdam Schiphol, Singapour Changi et Zurich ont adopté des pratiques similaires, tandis que SFO est la première grande mise en œuvre aux États-Unis, où certains aéroports offrent seulement des salles calmes ou une réduction du bruit près des portes. Les partisans affirment que le silence réduit le stress et rend l'aéroport plus inclusif pour les voyageurs neurodivergents ou sensibles à la surcharge sensorielle, même si les personnes malvoyantes peuvent dépendre davantage des alertes sonores. Avec la généralisation des notifications par applications mobiles, textos et panneaux numériques, les annonces paraissent souvent superflues pour la plupart des voyageurs, qui montrent globalement une préférence pour un environnement plus calme.