HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

5780 articles Page 27/578 Sans filtre

06:04

Launch HN: Intuned (YC S22) – Build and run reliable browser automations as code

Un agent piloté par l'IA génère, déploie et corrige automatiquement du code Playwright prêt pour la production afin d'automatiser des tâches web. Il peut créer divers types d'automatisations (scrapers, workflows RPA, crawlers) et proposer des modifications validées sur le site en direct sous forme de diff. En cas d'erreur, l'agent analyse les traces et propose une correction automatique d'un clic, et l'infrastructure gère l'authentification, la résolution de captchas et les proxys. La plateforme fournit un environnement de développement local en CLI, une intégration CI/CD, des contrôles d'accès en équipe et des outils d'observabilité avec logs et enregistrements de sessions. Des modèles et des exemples prêts à l'emploi sont disponibles sur GitHub pour faciliter le démarrage et l'intégration dans des workflows existants.

06:04

I'm building a parallel internet, and it's called The Thinnernet

Depuis 2020, l'auteur a adopté un alter ego à la Steve Jobs et a d'abord écrit une réflexion sur les bases de connaissances et l'idée d'une "Experience Base" intégrée à un concept de CMS appelé TicketMS pour mieux tracer les actions dans la gestion des tickets. La lecture d'un article de Dr. Nathalie Martinek a mis en lumière la lenteur ou la réticence des organisations à adopter des changements de flux de travail et a conduit l'auteur à insister sur l'importance de l'expérience utilisateur et employé. Il propose le concept de "Thinnernet", une approche de repli à faible bande passante consistant en modes minimisés et en listes blanches de contenus essentiels pour garantir une expérience prévisible sur des connexions allant de 1 Mbps à plusieurs Tbps. L'essai compare les évolutions matérielles et d'infrastructure, comme les câbles sous-marins et la fibre optique, aux choix de conception logicielle et plaide pour une architecture en couches où les données importantes arrivent en priorité selon plusieurs paliers de vitesse. L'auteur conclut que, face à des plateformes gourmandes en bande passante et à des pratiques commerciales favorisant l'obsolescence, une réforme de l'expérience numérique inspirée du mouvement Arts and Crafts favoriserait un internet adaptable, économe et accessible.

06:04

FrontierCode

FrontierCode est un nouveau benchmark qui évalue la capacité des modèles à produire du code de qualité prêt à être mergé, en mesurant la mergeabilité plutôt que la seule correction fonctionnelle. Il combine des critères bloquants et non bloquants couvrant la correction, la qualité des tests, la portée des modifications, le style et la conformité aux normes, et introduit des méthodes nouvelles comme reverse-classical, le contrôle de scope et le grading adaptatif basé sur des LLMs. Plus de vingt mainteneurs de projets open source ont conçu 150 tâches réalistes (chacun investissant plus de 40 heures) et un pipeline de contrôle qualité multi-étapes permet de réduire de 81 % les faux positifs par rapport à SWE-Bench Pro. Les résultats montrent que même les meilleurs modèles actuels éprouvent des difficultés sur les tâches les plus difficiles : Claude Opus 4.8 obtient 13,4 % sur l’ensemble Diamond tandis que les modèles open source restent nettement moins performants. L’objectif est de fournir un signal fiable de préparation à la production pour les agents de code et l’évaluation sera ouverte aux créateurs de modèles sans publication publique des tâches pour éviter la contamination.

06:03

Why are cells small?

Le corps humain contient environ 30 000 milliards de cellules (sans les microbes) dont les volumes internes varient sur environ cinq ordres de grandeur, du spermatozoïde minuscule à l'ovocyte gigantesque. La première contrainte physique majeure est le rapport surface/volume, puisque le volume croît plus vite que la surface, limitant l'apport de nutriments, l'élimination des déchets et la production d'énergie par la membrane. La diffusion impose une autre limite, car à mesure que le volume augmente les rencontres aléatoires entre molécules deviennent plus rares et plus lentes dans le cytoplasme encombré, ce qui ralentit réactions enzymatiques et signalisation. Les cellules s'adaptent à ces contraintes par la forme et la compartimentation: par exemple les globules rouges sont biconcaves pour augmenter la surface, les ovocytes accumulent nutriments et mitochondries et les cellules eucaryotes utilisent des organites pour rapprocher les réactions. Il existe des exceptions, comme Thiomargarita magnifica qui réduit les distances de diffusion en remplissant son intérieur d'une vacuole, mais en général la taille et la forme cellulaires résultent d'un compromis entre diffusion, rapport surface/volume et exigences fonctionnelles.

06:03

Porting the ThinkPad X61 to Coreboot

L'auteur décrit sa trajectoire depuis un ThinkPad x60 vers une collection de portables et son engagement dans le projet coreboot, motivé par le désir d'exécuter du firmware libre. Il a utilisé des outils classiques comme inteltool, lspci, acpidump et ectool pour récupérer des dumps et des références du BIOS afin de faciliter le reverse engineering. En intégrant un agent LLM (Claude Opus 4.6) avec Ghidra et radare2, il a accéléré l'analyse du raminit mais a dû beaucoup guider le modèle grâce à sa connaissance matérielle. Après itérations et tests matériels, il a porté libgfxinit, adapté le raminit pour GM965/ICH8 et corrigé erreurs et hallucinations du modèle avant l'upstreaming. Il conclut que les LLM rendent le reverse engineering de firmware plus accessible, évoque des opportunités pour l'analyse de l'Intel FSP et un port expérimental vers fstart en Rust.

06:03

Passing DBs through continuations

Les implémentations naïves d'opérateurs relationnels créent des résultats intermédiaires coûteux et le modèle itérateur introduit des surcoûts de dispatch dynamique. En style continuation-passing (CPS), chaque opérateur reçoit une continuation qui décrit ce qu'il faut faire pour chaque élément, ce qui permet de définir des opérateurs comme des transformations qui s'enchaînent sans matérialiser d'intermédiaires. En combinant CPS et l'inline du compilateur, des chaînes d'opérateurs sont développées en une boucle fusionnée, illustrée par des fonctions compose, product, scan_id et probe qui aboutissent à une exécution colonnaire efficace. Prela normalise les tables en relations binaires et utilise cette approche CPS en Julia pour générer automatiquement du code fusionné, atteignant des performances comparables à DuckDB sur certains benchmarks. La méthode repose sur des hypothèses pratiques comme la densité des clés primaires et une tolérance aux temps de JIT, mais elle sépare proprement le rôle du moteur et du compilateur et rend le système extensible.