HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

3130 articles Page 1/313 Sans filtre

06:10

Generating Hierarchical JSON Representations of Scientific Sentences Using LLMs

Cet article étudie si des représentations structurées peuvent conserver le sens des phrases scientifiques. Pour cela, un petit modèle de langage est affiné avec une nouvelle fonction de perte structurelle afin de générer des structures JSON hiérarchiques à partir de phrases extraites d'articles scientifiques. Ces JSON servent ensuite à un modèle génératif chargé de reconstruire le texte original. Les auteurs comparent phrases originales et reconstruites au moyen de mesures de similarité sémantique et lexicale. Les résultats montrent que des formats hiérarchiques peuvent préserver efficacement l'information des textes scientifiques.

06:09

Designing the Transport Typeface

Le travail de Margaret Calvert est omniprésent dans le paysage britannique, de la signalisation routière aux pictogrammes des gares et du NHS, et elle a également été professeure influente au Royal College of Art. Avec son partenaire Jock Kinneir, elle a été recrutée dans le contexte du développement des autoroutes et des comités Anderson et Worboys pour créer un système de signalisation clair et adapté à la conduite à grande vitesse. Ils ont conçu la lettre Transport, inspirée d'Akzidenz-Grotesk et du Johnston, utilisant des minuscules et des majuscules et des détails de forme pour optimiser la lisibilité, et la police a été numérisée sous le nom de New Transport en 2009 en collaboration avec Henrik Kubel. Le projet comprenait aussi un code colorimétrique précis — texte blanc sur fond bleu pour les autoroutes, vert pour les routes A avec numéros jaunes, et noir sur blanc pour les routes B — qui visait à améliorer la lisibilité à distance. La réforme a été officiellement adoptée par la loi en 1965 et, malgré des critiques telles que celles du graveur David Kindersley, des essais ont confirmé la supériorité de leur typographie, tandis que Calvert, autodidacte en dessin de lettre grâce à sa pratique du dessin d'après nature, a ensuite créé d'autres fontes et identités visuelles.

06:09

Average is all you need

Les modèles de langage ont rendu facile et rapide la production de contenus ou d'analyses de qualité moyenne qui auparavant demandaient du temps et des compétences. L'article explique que la même automatisation affecte maintenant les logiciels et les tâches basées sur des descriptions textuelles, comme le traitement de données et l'analyse. rawquery est présenté comme une plateforme de données conçue pour être pilotée par des agents LLM qui se connectent aux sources, écrivent le SQL, exécutent les requêtes et génèrent des graphiques à partir d'instructions en langage naturel. L'auteur illustre le fonctionnement avec un exemple reliant Stripe et HubSpot où l'agent synchronise les données, compare des cohortes selon l'exposition à une campagne email et produit des tableaux et des graphiques partageables. Le point central est que l'automatisation de ces tâches moyennes permet aux utilisateurs de se concentrer sur l'interprétation et la décision sans avoir nécessairement besoin d'une équipe de data ingénieurs.

06:09

How to Host a Blog on a Subdirectory Instead of a Subdomain (2025)

L'article explique comment héberger un blog dans un sous-répertoire (par exemple example.com/blog) plutôt que sur un sous-domaine pour améliorer le SEO et l'expérience utilisateur. Il rappelle que les sous-répertoires consolident l'autorité du site et semblent souvent mieux performer en classement, tout en notant que Google déclare ne pas traiter les sous-domaines comme des entités séparées. L'auteur précise que la migration est plus complexe et chronophage parce que de nombreuses plateformes sont conçues pour des sous-domaines et exigent une configuration soignée. La procédure détaillée consiste à configurer les enregistrements DNS dans Cloudflare, définir basePath dans Next.js, déployer un Cloudflare Worker qui proxy les requêtes de /blog vers le sous-domaine et ajouter des routes pour les assets. Enfin, il recommande d'ajouter un X-Robots-Tag noindex sur le sous-domaine, de supprimer cet en-tête dans le Worker pour le sous-répertoire et de vérifier l'indexation via l'outil d'inspection d'URL de Google.

06:09

Teddy Roosevelt and Abraham Lincoln in the same photo (2010)

Dans les années 1950, Stefan Lorant a identifié sur une photo datée du 25 avril 1865 la maison de Cornelius van Schaack Roosevelt pendant le cortège funèbre d'Abraham Lincoln qui descendait Broadway à New York. En examinant l'image, il a remarqué à une fenêtre du deuxième étage les têtes de deux garçons et a obtenu la confirmation de l'épouse de Theodore Roosevelt qu'il s'agissait de Theodore et d'Elliott Roosevelt. Elle a raconté qu'enfant elle avait été emmenée chez son grand-père pour voir la procession, qu'elle avait été effrayée par les draperies noires et qu'on l'avait enfermée dans une pièce arrière, de sorte qu'elle n'avait pas vu les funérailles. En 1952, Josephine Cobb, cheffe de la section des images fixes aux Archives nationales, a découvert un négatif sur plaque de verre pris par Mathew Brady montrant le podium des orateurs à Gettysburg en 1863. L'agrandissement de ce négatif a établi qu'Abraham Lincoln se trouvait sur ce podium quelques heures avant son célèbre discours, et l'article signale l'ouverture de la deuxième partie de l'exposition Discovering the Civil War à Washington, D.C.

06:08

Solitaire simulator for finding the best strategy: Current record is 8.590%

Le dépôt propose un simulateur de Solitaire conçu pour explorer et comparer des stratégies de jeu. Les versions 1.0 à 1.2 décrivent l'évolution du comportement : 1.0 utilisait des choix basiques, 1.1 ajoute un paramètre seed pour rendre le brassage reproductible, et 1.2 modifie l'ordre des actions, faisant passer le taux de victoire de 7,915 % à 8,590 %. La compilation se fait avec Apache Ant (cibles clean et compile.java) et l'exécutable se lance via java -jar simulator.jar avec les options --one/--three, --attempts, --debug et --seed pour contrôler le tirage, les tentatives et la verbosité. Le README indique qu'un million de parties prend moins d'une heure sur un M2 MacBook Air sans debug, que sans --debug seules les parties gagnantes sont affichées, et que --debug produit une sortie détaillée. Un exemple d'exécution montre le format de sortie détaillé, la légende des actions (s2g, b2b, b2g, s2b, g2b) et la séquence des boucles/flops aboutissant à la détection d'un gagnant.