HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

6662 articles Page 266/667 Sans filtre

06:06

Ted Turner has died

Ted Turner est décédé mercredi à l'âge de 87 ans, entouré de sa famille, selon Turner Enterprises. Il a révolutionné la télévision en lançant CNN en 1980, la première chaîne d'information 24 heures sur 24, et a étendu son empire à des chaînes comme TBS, TNT, TCM et Cartoon Network ainsi qu'à des équipes sportives comme les Atlanta Braves. Philanthrope et conservationniste, il a créé la United Nations Foundation, soutenu l'élimination des armes nucléaires, réintroduit le bison en Amérique et a promis un milliard de dollars à l'ONU. Né en 1938, il a repris l'entreprise familiale de panneaux publicitaires à 24 ans après le suicide de son père, a vendu ses réseaux à Time Warner en 1996 et a ensuite vu sa fortune fortement diminuer après la fusion AOL‑Time Warner. Atteint de démence à corps de Lewy, il laisse cinq enfants, quatorze petits-enfants et deux arrière‑petits‑enfants, et est salué par des collègues comme une figure majeure des médias et de l'environnement.

06:06

Show HN: PHP-fts – Full-text search engine in pure PHP, no extensions

Ce moteur de recherche full‑text est écrit en PHP pur sans extensions ni dépendances et fonctionne uniquement avec des fichiers. Il vise les environnements sans possibilité de déployer un service dédié (hébergement mutualisé, petit VPS) et convient pour des jeux de données de quelques centaines à quelques dizaines de milliers de documents. Il propose indexation par trigrammes tolérante aux fautes, classement BM25+IDF, boost de champs, filtres complexes, insertion en masse, suppression douce et compactage pour la maintenance. Les index sont stockés dans des fichiers binaires portables (documents.bin, trigrams.bin, postings.bin, tombstones.bin), requièrent PHP 8.1+ et un accès en lecture/écriture à un répertoire. Les benchmarks indiquent des insertions plus rapides en mode batch et des recherches rapides sur hébergement mutualisé (médiane ≈ 3,2 ms pour 10 000 documents), mais l'outil n'est pas adapté aux millions de documents ni aux charges d'écriture concurrentes élevées.

06:06

A Theory of Deep Learning

L'article commence par une analogie avec Borges pour souligner que la mémoire totale sans oubli empêche l'abstraction et compare cela à la tendance des modèles de deep learning à croître indéfiniment. Il rappelle les paradoxes empiriques contemporains — benign overfitting, double descent, implicit bias et grokking — qui contredisent les prédictions classiques du compromis biais-variance. Les auteurs proposent une théorie en espace de sortie basée sur le noyau tangent neural empirique et son intégrale temporelle, qui partitionne les directions d'apprentissage en un canal de signal et un réservoir test-invisible. Dans ce cadre, le caractère généralisation ou mémorisation d'une direction s'explique par sa place dans le spectre intégré du noyau et par la dynamique de gradient qui favorise d'abord les modes à forte mobilité. La théorie conduit à une règle pratique de mise à jour par paramètre pour limiter la mémorisation, permet d'entraîner directement sur le risque de population et ouvre la voie à des architectures plus efficaces.

06:06

Perturb-MARS: Reading mouse experiments through a human lens

Noetik a développé Perturb-Map, une plateforme in vivo multiplexée qui teste des centaines de perturbations génétiques simultanément dans la même souris en conservant la résolution spatiale grâce à des codes protéiques (Pro-Codes) et à l'immunomarquage. Ils ont aussi entraîné TARIO-2, un modèle fondation exclusivement sur tissus cancéreux humains capable de prédire l'expression génique spatiale à partir d'une coloration H&E, et ce modèle généralise aux images H&E de souris pour projeter les résultats expérimentaux dans un espace biologique humain. La combinaison, nommée Perturb-MARS, permet d'interpréter les écrans multiplexés murins en coordonnées humaines, validation appuyée par des analyses agrégées montrant des patrons cohérents d'infiltration immune et la capture d'effets observés cliniquement. Les applications incluent la nomination de nouvelles cibles thérapeutiques, l'identification d'associations ou d'antagonismes pour des combinaisons de traitements et la stratification mécanistique des patients, le tout à grande échelle en s'appuyant sur l'H&E peu coûteux. Ce dispositif crée une boucle active entre interventions expérimentales et modèles génératifs pour améliorer la simulation de la biologie tumorale humaine, et l'équipe indique qu'elle recherche des partenaires pour étendre la plateforme.

06:05

Learning the Integral of a Diffusion Model

Les modèles de diffusion génèrent des échantillons en suivant itérativement des directions tangentielles prédites par un débruiteur, ce qui transforme progressivement du bruit en données via une trajectoire unique entre chaque paire bruit‑donnée. Les flow maps apprennent directement l'intégrale de cette vitesse en prédisant, pour un point source et deux temps donnés, la position cible sur la même trajectoire, ce qui permet potentiellement d'échantillonner en très peu ou un seul pas. Trois règles de cohérence — compositionalité, cohérence lagrangienne et cohérence eulérienne — formalisent les propriétés indispensables des flow maps et servent de base à des fonctions de perte utilisées pour l'entraînement. Les méthodes d'entraînement varient : distillation depuis un diffuseur préentraîné, auto‑distillation, apprentissage marginal‑à‑conditionnel (MeanFlow, iMF) et techniques pratiques (stop‑gradient, JVP, différences finies, curricula) pour éviter des dérivées d'ordre supérieur et stabiliser l'optimisation. En pratique, les flow maps offrent des gains pour l'échantillonnage rapide, le guidage différentiable et l'adaptation aux données discrètes ou aux espaces non euclidiens, mais elles nécessitent un entraînement plus complexe et coûteux et impliquent des compromis en fidélité et diversité selon la méthode choisie.

06:05

Building my own Vi text editor in BASIC

L'auteur explique qu'il aime réinventer des outils par curiosité et par apprentissage, avec une approche artisanale liée à un parcours artistique plutôt qu'informatique formel. Il décrit son intérêt pour des langages et paradigmes non conventionnels, notamment les langages de script et BASIC (Yabasic) qu'il a exploré pour divers projets. Inspiré par des projets comme The People's Permacomputer et des clients TUI simples, il a développé yvi, un éditeur minimaliste de type vi écrit en Yabasic. Commencé en une centaine de lignes pour les commandes de base puis étendu à environ 500 lignes avec des fonctions de navigation, édition, recherche et annulation, yvi est désormais utilisable pour écrire et coder malgré quelques bugs. Le code est décrit comme modifiable et fonctionnel plutôt que propre, et le projet est accessible sur GitHub et Tildegit pour ceux qui veulent l'essayer ou le modifier.

06:05

Community firmware for the Xteink X4 e-paper reader

CrossPoint Reader est un firmware libre développé comme remplacement open source pour le lecteur à encre électronique Xteink X4. Le projet, non affilié au fabricant, vise à fournir une expérience de lecture EPUB complète sur matériel contraint tout en ouvrant l'écosystème. Parmi les fonctionnalités figurent le parsing EPUB 2/3 avec images, sauvegarde de la position de lecture, explorateur de fichiers et options de police et mise en page configurables. L'installation se fait via une interface web ou en ligne de commande avec esptool, et le développement repose sur PlatformIO et des outils Python pour le flashage et le débogage. Pour compenser la RAM limitée de l'ESP32‑C3, le firmware met en cache les chapitres sur la carte SD dans un répertoire .crosspoint et le projet accepte les contributions communautaires sur GitHub.

06:04

Show HN: Tilde.run – Agent sandbox with a transactional, versioned filesystem

Tilde transforme chaque exécution d'agent en une transaction réversible en fournissant un système de fichiers versionné qui agrège code (GitHub), données (S3) et documents (Drive). Chaque run s'exécute dans un sandbox isolé serverless où les modifications sont engagées atomiquement à la réussite ou annulées en cas d'échec, sans gestion d'infrastructure manuelle. La plateforme applique une isolation réseau par défaut, contrôle et journalise chaque appel sortant avec des politiques par-action pour bloquer l'exfiltration de données et l'accès non autorisé. Un historique détaillé permet d'auditer les changements, d'inspecter les diffs et de revenir instantanément à un commit, et les agents disposent d'un RBAC granulaire pouvant exiger une approbation humaine. L'outil propose un CLI et une API pour démarrer rapidement des sandboxes interactifs ou non, et repose sur l'expérience de l'équipe à l'origine de lakeFS.