HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

5824 articles Page 41/583 Sans filtre

06:02

Moving beyond fork() + exec()

Depuis les débuts d'Unix, la création de processus repose sur fork() puis exec() (appelés clone() et execve() sous Linux), une approche élégante mais coûteuse car fork() duplique tout l'état du processus et est souvent suivi immédiatement d'un exec() qui jette cette copie. Li Chen a proposé des "spawn templates" qui permettent de créer avec spawn_template_create() un descripteur de modèle pour un exécutable afin que le noyau mette en cache des informations et accélère les exécutions répétées du même programme. L'appel spawn_template_spawn() utilise une structure précisant argv, envp et une liste d'actions (spawn_template_action) permettant de fermer ou dupliquer des descripteurs, ouvrir des fichiers, changer le répertoire de travail ou modifier le traitement des signaux avant d'exécuter le processus. Les tests fournis montrent un gain d'environ 2 % et l'implémentation suit grosso modo le chemin fork()/exec() en conservant les contrôles habituels du noyau, mais la proposition ne sera pas acceptée sous sa forme actuelle. Les relecteurs ont recommandé de créer plutôt un processus «pristine» via pidfd avec une interface pidfd_config() pour le configurer et ainsi permettre une implémentation user-space de posix_spawn(), orientation que Chen a indiqué vouloir suivre.

06:02

Show HN: Oproxy – inspect and modify network traffic from the browser

Il s'agit d'un proxy local HTTP, HTTPS et SOCKS5 permettant d'inspecter, rejouer et modifier le trafic. Il propose la capture et la visualisation détaillée des requêtes et réponses (en-têtes, corps, statuts, timings), ainsi que l'export au format HAR et en snippets cURL/Fetch/Python. On peut rejouer ou construire manuellement des requêtes, appliquer des règles de modification (map-remote, map-local, throttling, points d'arrêt, mocks), utiliser des scripts Lua et chaîner un proxy en amont. Le service se lance depuis le code source ou via Docker/Compose avec persistance des certificats et de l'état, et expose une interface de gestion web et des API d'administration. Les cas d'utilisation incluent le débogage de navigateurs et CLI sans modifier le code, le test avec réponses factices, la reproduction de conditions réseau lentes et la validation de comportements client face aux réécritures ou blocages.

06:01

Biohub releases a world model of protein biology

Biohub a rendu publiques une collection d'outils open source constituant un modèle mondial de la biologie des protéines comprenant ESMC, ESMFold2 et ESM Atlas, accessibles gratuitement sur la plateforme Biohub. ESMC est un modèle de langage entraîné sur environ 2,8 milliards de séquences issues de tous les règnes du vivant et dont les représentations capturent des principes fondamentaux de la séquence, de la structure et de la fonction protéiques. ESMFold2 convertit ces représentations en structures 3D atomiques et permet de concevoir des ligands protéiques, montrant des performances de pointe sur des benchmarks et produisant en quelques jours des candidats validés en laboratoire contre cinq cibles liées au cancer et à l'immunologie. ESM Atlas rend navigable un espace de 6,8 milliards de séquences et 1,1 milliard de structures prédites, révélant des relations évolutives et des régions biologiques non annotées utiles pour explorer des mécanismes encore mal compris. Les auteurs expliquent que l'entraînement sur l'enregistrement évolutif permet au modèle d'internaliser les règles du repliement et des interactions protéiques et estiment que l'ouverture de ces outils accélérera la découverte et la conception de nouveaux thérapeutiques.

06:01

Introducing Boron Buckyballs: Theory that B80 cages can’t be made is disproved

Des chimistes ont observé expérimentalement pour la première fois une buckminsterfullerène de bore à 80 atomes (B80) par spectroscopie photoélectronique, le spectre montrant trois pics nets compatibles avec une cage de type fullerène. Les clusters de bore ont été produits par vaporisation laser d'une cible de bore dans un gaz porteur hélium-argon, le refroidissement permettant à B80 de se stabiliser dans une structure unique. Cette observation entre en conflit avec de nombreux calculs basés sur la théorie de la fonctionnelle de la densité (DFT), et les auteurs ont simulé les spectres de toutes les structures concurrentes pour ne trouver de concordance qu'avec la cage en buckyball. Plusieurs spécialistes demandent des confirmations indépendantes et soulignent que l'écart énergétique prédit par DFT peut être relativisé par atome, tandis que l'équipe estime que le résultat remet en cause certaines méthodes DFT pour ce système. B80 est valence-isélectronique de C60 et pourrait être un meilleur accepteur d'électrons avec des applications potentielles (semi-conducteur, stockage d'hydrogène, supraconductivité dopée), mais la synthèse en volume reste non réalisée et dépendra de la stabilité des liaisons bore–bore et des études de réactivité et de clusters plus grands.

06:01

How Liminalism Became the Defining Aesthetic of Our Time

Ce mouvement numérique, organisé par des communautés en ligne, met en avant des images d'espaces vides et familiers qui provoquent malaise et nostalgie. Son renouveau récent s'est popularisé via le Creepypasta "The Backrooms" de 2019, des vidéos virales pendant les confinements et des groupes Reddit, Facebook et TikTok qui partagent massivement ces photographies. Les images se caractérisent par l'absence de personnes, la sensation d'entre-deux et une atmosphère de simulation renvoyant à l'aliénation du capitalisme tardif et à l'isolement numérique. Les contributeurs refusent souvent les œuvres générées par IA et revendiquent la valeur de l'art trouvé et démocratique, détaché des institutions artistiques traditionnelles. L'esthétique puise ses filiations dans l'histoire de l'art — de de Chirico à Magritte et Hopper — en renouant avec des thèmes de perspectives anormales, de solitude et d'espaces sans lieu.

06:01

Human-Like Neural Nets by Catapulting

L'article propose d'entraîner des réseaux neuronaux très surparamétrés avec des taux d'apprentissage extrêmement élevés et une forte régularisation sur de petits jeux de données soigneusement filtrés afin de provoquer des transitions de type "catapulting" ou "grokking" menant à une généralisation proche de celle des humains. L'auteur suggère que ce changement de paradigme pourrait expliquer plusieurs anomalies entre modèles artificiels et cerveaux biologiques, notamment la faible efficience en donnée des LLMs, l'oubli humain, la résistance humaine aux exemples adverses et les différences de dynamique d'apprentissage, via un déplacement du compromis biais-variance. Il décrit des protocoles expérimentaux testables — par exemple entraîner des modèles multi-trillions pendant peu d'étapes avec des calendriers cycliques de learning rate, et prototyper sur des problèmes ciblés comme l'arithmétique difficile, ImageNet-hard et la robustesse adversaire. Les résultats attendus sont une généralisation plus robuste et résistante aux attaques adverses, une meilleure interprétabilité et alignement des modèles, la possibilité de compresser ensuite ces modèles et des implications économiques et matérielles fortes pour la formation sérielle. Enfin, le texte explore des variantes pratiques telles que des MLP profonds, la "dynamic grokking" pour faire réfléchir un modèle sur un problème difficile, et insiste sur le caractère spéculatif mais vérifiable de la proposition via des balayages d'hyperparamètres et des benchmarks adaptés.

06:00

Symbolica 2.0: Programmable Symbols for Python and Rust

La version 2.0 du framework apporte des symboles programmables permettant de personnaliser la simplification, la dérivation, l'expansion, l'affichage et l'évaluation des objets mathématiques, et de transformer des expressions symboliques en noyaux numériques performants. L'API Rust a été simplifiée avec un prelude, plus d'overloads, des conversions automatiques et un style builder facilitant la construction d'évaluateurs et de fonctions. La sortie a été enrichie avec un mode d'habillage automatique, affichages colorés et HTML pour notebooks, sortie Typst et options LaTeX pour une meilleure lisibilité des expressions. Le système d'évaluation a été revu : hooks numériques personnalisables, compilation JIT, arithmétique double-float, prise en charge étendue de fonctions spéciales et une implémentation de callbacks avec effacement de type pour concilier flexibilité et performances. Des optimisations internes (optimisation d'expressions, algorithmes de GCD, élimination de paires communes) augmentent les performances de 2 à 10 000x selon les cas, une option sans GMP pour un build WASM est prévue et le projet reste gratuit pour les hobbyistes avec des licences commerciales disponibles, l'IA ayant été utilisée principalement pour des tâches périphériques.

06:00

Ntsc-rs – open-source video emulation of analog TV and VHS artifacts

Il s'agit d'un effet vidéo libre et open source qui émule les artefacts des télévisions analogiques et des cassettes VHS. L'algorithme reproduit de manière fidèle la transmission NTSC et l'encodage VHS, en s'appuyant sur des travaux antérieurs comme composite-video-simulator, zhuker/ntsc et ntscQT. Le code est écrit en Rust, multithreadé et optimisé par SIMD, ce qui permet des performances élevées et un traitement en temps réel. Il peut fonctionner à des résolutions bien supérieures à celles du NTSC original, contrairement à certains effets similaires. L'effet est disponible en application autonome, en version web et sous forme de plugin pour After Effects, Premiere et tous les logiciels compatibles OpenFX tels que DaVinci Resolve, Hitfilm et Vegas.