HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

3130 articles Page 239/313 Sans filtre

07:08

Show HN: A real-time strategy game that AI agents can play

LLM Skirmish est un benchmark où des modèles de langage s'affrontent en 1v1 dans des jeux de stratégie en temps réel, leurs stratégies étant écrites sous forme de code puis exécutées dans l'environnement du jeu. Chaque tournoi dure cinq rounds et permet aux modèles de modifier leur script entre les rounds en se basant sur les résultats précédents afin d'évaluer l'apprentissage en contexte. Le cadre repose sur OpenCode et des conteneurs Docker, l'orchestrateur envoyant les prompts et validant les scripts avec jusqu'à trois tentatives de correction en cas d'erreur. Les résultats montrent des gains d'efficacité pour plusieurs modèles entre le round 1 et le round 5, mais Gemini 3 Pro constitue une anomalie avec une forte performance initiale et une régression ultérieure possiblement liée à la gestion du contexte. Le coût moyen par round est mesuré, Claude Opus 4.5 affiche le meilleur Elo mais un coût élevé, tandis que GPT 5.2 offre un meilleur rapport Elo par dollar, ce qui éclaire les compromis coût-performance.

07:07

New accounts on HN more likely to use em-dashes

L’auteur observe que Hacker News semble inondé de bots ces derniers mois, avec des comptes qui publient des contenus apparemment brillants mais souvent incohérents. L’ambiance est aussi perçue comme décalée, avec de nombreux commentaires banals ou hors sujet. Pour vérifier cela, il a extrait les commentaires récents de /newcomments et ceux des comptes nouvellement enregistrés via /noobcomments. Les résultats montrent que les commentaires des comptes nouvellement enregistrés utilisent environ dix fois plus souvent des tirets em-dash, des flèches et d’autres symboles, soit 17,47% contre 1,83%. Ils évoquent aussi l’IA et les LLM plus fréquemment (18,67% contre 11,8%), avec p = 7e-20 pour les symboles et p = 0,0018 pour les mentions, sur un échantillon d’environ 700 observations par catégorie.

07:07

LLM=True

Le texte analyse comment les agents de codage IA génèrent beaucoup de bruit dans la fenêtre de contexte et polluent les sorties, ce qui dilue les informations pertinentes. Il illustre ce problème avec un monorepo Typescript utilisant Turbo, où les logs de build arrivent en stdout et prennent place au détriment des données utiles. Des solutions sont proposées, notamment des ajustements dans turbo.json et dans les fichiers de configuration Claude, afin de filtrer les sorties et réduire le bruit via des variables d’environnement. Le texte évoque aussi d’autres variables comme NO_COLOR et CI=true, et explore l’idée d’un LLM=true pour minimiser l’usage des tokens et optimiser l’environnement. Il conclut que ces approches peuvent apporter des gains à la fois en coût et en efficacité, et suggère que les agents puissent devenir prépondérants en incitant à promouvoir l’idée de LLM=true.

07:07

Following 35% growth, solar has passed hydro on US grid

Aux États‑Unis, la demande d’électricité a augmenté d’environ 2,8% en 2025, soit environ 121 térawattheures. L’énergie solaire a connu une croissance de 35% par rapport à l’année précédente et a dépassé l’hydroélectricité pour la première fois. La production issue du charbon a augmenté de 13% et, sans nouvelles centrales nucléaires, une partie de la demande croissante a été satisfaite par les combustibles fossiles. L’expansion des énergies éolienne et solaire, associée à l’hydroélectricité, pourrait représenter près d’un quart du mix électrique américain, soutenue par 24 GW de stockage par batteries. Pour 2026, les projections prévoient 43 GW de solaire supplémentaires et 12 GW d’éolien, dont une part significative proviendra de projets offshore.

07:07

Danish government agency to ditch Microsoft software (2025)

Le ministère danois de la Digitalisation prévoit de remplacer Microsoft par des logiciels libres pour réduire sa dépendance vis-à-vis des entreprises technologiques américaines. Dans un entretien, la ministre Caroline Stage Olsen a confirmé que plus de la moitié du personnel migrera vers LibreOffice le mois prochain, avec une transition complète d’ici la fin de l’année. Elle a aussi indiqué que le ministère pourrait revenir à Microsoft si la transition s’avérait trop complexe. LibreOffice, développé par The Document Foundation, est disponible sur Windows, macOS et Linux et propose des outils de traitement de texte, feuilles de calcul, présentations et autres fonctionnalités. Cette démarche s’inscrit dans une tendance européenne vers la souveraineté numérique, suivie par Copenhague, Aarhus et Schleswig-Holstein qui prévoient des migrations vers LibreOffice et Linux.

07:07

Show HN: I ported Tree-sitter to Go

Il s'agit d'un runtime Tree-sitter entièrement en Go, sans CGo ni toolchain C, et prêt pour WASM. Il réutilise le même format de parse-table que Tree-sitter, permettant d'utiliser les grammars existantes sans recompilation et offrant des performances supérieures au binding CGo, notamment pour les éditions incrémentales qui sont 90x plus rapides. Le système prend en charge le parsing initial, l'édition incrémentale, les requêtes S-expression, le surlignage syntaxique et le balisage des symboles. Son architecture réimplémente le runtime Tree-sitter en Go, avec un parseur LR(1) à tables, du GLR, un allocateur en arène, un DFA lexer et une machine virtuelle pour les scanners externes. Des guides et mécanismes de détection de langage facilitent l'intégration dans les éditeurs, et l'écosystème comprend des tests et une feuille de route.

07:06

Trellis AI (YC W24) is hiring deployment lead to accelerate medication access

Trellis AI conçoit et déploie des agents autonomes qui automatisent l’entrée de documents, les autorisations préalables et les recours pour rationaliser les opérations et accélérer les soins. Leurs agents traitent des flux importants de thérapies et couvrent tous les États, en classant les références médicales, interprétant les notes et automatisant la recherche de contrats et de remboursements pour déterminer la couverture et les coûts. Trellis est une spin-off du Stanford AI Lab et bénéficie du soutien d’investisseurs majeurs tels que YC, General Catalyst, Telesoft Partners et des cadres de Google et Salesforce. Le poste décrit un Lead Deployment Strategist recherché, nécessitant au moins trois ans d’expérience en rôle client, en déploiement technique dans des environnements complexes et en gestion de projet. L’entreprise promet un impact réel à grande échelle, du travail auprès de leaders opérationnels de l’industrie et une forte autonomie dans une équipe en forte croissance, avec une trajectoire d’adoption et de revenus en hausse.

07:06

Text-Based Google Directions

Le texte décrit une interface de planification de trajet avec des champs Pays et Mode de déplacement. Il permet de choisir les modes de transport en commun préférés tels que Any rail, Train, Tram, Subway / Underground et Bus. Une option d’affichage propose d'inclure les sous-étapes à pied et d'afficher plusieurs itinéraires si disponibles. Le pays n’est pas renseigné dans le texte fourni, ce qui montre que les valeurs restent à compléter. L’objectif global est de présenter des préférences et des options d’affichage pour générer des itinéraires potentiels.