HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

5732 articles Page 15/574 Sans filtre

06:08

Can LLMs Beat Classical Hyperparameter Optimization Algorithms?

Cette étude utilise le dépôt autoresearch pour comparer des algorithmes classiques d'optimisation d'hyperparamètres et des agents LLM en réglant directement le code d'entraînement sous un budget de calcul fixe. Dans un espace de recherche fixé, des méthodes classiques comme CMA-ES et TPE surpassent systématiquement les agents LLM, où l'évitement des erreurs d'épuisement de mémoire prime sur la diversité de recherche. Permettre à un LLM d'éditer le code source réduit l'écart mais ne le comble pas, même avec des modèles de pointe tels que Claude Opus 4.6 et Gemini 3.1 Pro, en partie parce que les LLM peinent à suivre l'état d'optimisation entre les essais. Pour tirer parti des connaissances des LLM et de l'interprétabilité des méthodes classiques, les auteurs introduisent Centaur, un hybride qui partage l'état interne de CMA-ES avec un LLM et obtient les meilleurs résultats, où un modèle de 0,8 milliard de paramètres suffit à dépasser les approches classiques et purement LLM. Les auteurs constatent aussi que l'édition de code sans contraintes exige des modèles plus gros pour être compétitive, et concluent que les LLM sont surtout efficaces comme complément aux optimisateurs classiques; les expériences incluent des analyses de diversité de recherche, d'évolution en taille de modèle et d'ablation, et le code ainsi qu'une démonstration interactive sont disponibles.

06:07

Thi.ng – open-source building blocks for computational design and art

Ce projet est une vaste collection open source dédiée au design computationnel, composée d'environ 350 sous-projets couvrant de nombreux domaines et technologies. Il est créé et maintenu par Karsten Schmidt depuis 2006 avec le soutien de contributeurs, et ses travaux ont été exposés et enseignés internationalement. La philosophie repose sur une croissance bottom-up et des modules petits et recombinables, privilégiant la composition, l'interopérabilité, les structures de données puissantes et des approches fonctionnelles et déclaratives. Depuis cinq ans l'effort principal s'est concentré sur des outils orientés données en TypeScript via un monorepo umbrella regroupant des centaines de packages, exemples et une documentation auto-générée sous licence Apache 2.0. Les ressources sont largement utilisées en enseignement, industrie et arts, ont contribué à des projets primés et sont soutenues par divers sponsors et institutions via contributions et financements.

06:07

Show HN: Nucleus – A security-hardened, Nix-native container runtime

Nucleus est un runtime de conteneurs minimaliste pour Linux qui fournit des environnements isolés en utilisant directement les primitives du noyau pour réduire les surcoûts des runtimes traditionnels. Il s'intègre profondément à Nix et NixOS en privilégiant un modèle entièrement déclaratif où les rootfs sont construits comme des closures reproductibles et montés à l'exécution. Trois modes opératoires existent : agent (sandbox éphémère et démarrage rapide), strict-agent (isolement fail-closed pour agents) et production (isolement strict pour services NixOS avec contrôles de santé, politiques d'egress et intégration systemd). La sécurité repose sur cgroups v2, namespaces, capabilities, seccomp, Landlock et une intégration optionnelle de gVisor, avec des politiques externes auditées et des outils pour générer des profils seccomp à partir de traces. Les benchmarks montrent un démarrage à froid très rapide et des performances proches du métal nu pour PostgreSQL en runtime natif, et l'outil offre aussi des topologies TOML, un mode détaché supervisé par systemd et la vérification/attestation des rootfs.

06:07

Biff.core: system composition for Clojure web apps

L'auteur a refondu Biff en une douzaine de bibliothèques et publie désormais la première d'entre elles. La bibliothèque biff.core fournit la composition du système et les interfaces qui servent de colleur entre les autres bibliothèques. Biff 2 conserve la structure modules/components et introduit des fonctions d'initialisation (:biff.core/init) pour agréger proprement des maps de modules en un map système sans copier-coller de code. Pour préserver le comportement de liaison tardive (mise à jour des handlers sans redémarrage), les fonctions d'initialisation reçoivent la var du vecteur de modules et les entrées dynamiques du map système doivent être des fonctions qui déréférence cette var et appellent une fonction mémorisée pour construire la ressource. L'auteur justifie le maintien d'un vecteur de composants séparé pour éviter la complexité de gestion automatique des dépendances de cycle de vie tout en notant qu'on peut superposer une couche pour ordonner les composants si nécessaire, et signale que son équipe recrute un ingénieur principal.

06:07

Flat Datacenter Networks at Scale at Amazon

Les recherches sur les réseaux favorisant le routage optimal remontent aux années 1970 avec la notion d'expander, les travaux de Valiant, les constructions optimales de Lubotzky-Phillips-Sarnak et des résultats montrant qu'un graphe aléatoire est presque aussi bon (renforcé en 2023). L'industrie réseau a privilégié l'architecture fat-tree inspirée des interconnexions Clos, et des travaux comme VL2 (2009) ont montré que la randomisation du routage améliore les performances tout en conservant une topologie hiérarchique et coûteuse à câbler. Des propositions plus radicales comme Jellyfish (2012) ont relié les graphes aléatoires aux centres de données mais ont laissé en suspens trois défis pratiques majeurs : routage, câblage et exploitation. À partir de 2023, une équipe d'Amazon (Bernardi, Mahajan, Seshadhri et autres) a conçu une solution nommée RNG combinant le schéma de routage Spraypoint, le dispositif optique ShuffleBox et des outils d'installation, et a construit des centres de données pilotes à Dublin (2024), puis en Allemagne et en Espagne pour valider le concept. Les déploiements ont montré des gains importants — 69 % de routeurs en moins, 33 % de débit en plus, 40 % de consommation électrique en moins et 27 % de coût opérationnel en moins — offrant résilience, efficacité et scalabilité incrémentale, tandis que la complexité opérationnelle et la nature stochastique des garanties sont atténuées par des outils et des modèles de conception.

06:06

Bit Propagation over a Noisy Grid

L'article présente un problème ouvert : on envoie un bit depuis l'origine sur une grille bruitée qui se propage en vague et on cherche à récupérer le bit initial en observant uniquement le front d'onde. En 1D l'information se perd rapidement à cause des inversions successives, et en 2D il a été prouvé qu'aucune fonction homogène ne préserve l'information (résultats connus pour la majorité restreinte). En 3D la question reste ouverte ; des simulations avec la règle de la majorité montrent qu'à haute température le bit s'efface vite tandis qu'à très faible température un comportement critique semble apparaître autour de 2^{-5} sans conclusion nette. Une simplification consistant à laisser les nœuds indéfinis en cas d'égalité et à n'autoriser le bruit que sur les axes suggère que le bruit des bords 1D peut se projeter sur le front d'onde et produire environ 50% de 1s et 0s. L'auteur conclut que, pour le cas restreint avec majorité homogène, les éléments analysés vont dans le sens d'une impossibilité en 3D mais souligne l'incertitude liée aux simplifications et appelle à des preuves rigoureuses et à l'exploration d'autres modèles.

06:06

Emerge Career (YC S22) Is Hiring a Founding Growth Marketer

Le poste recherche un growth marketer axé sur l'IA qui prendra la responsabilité des canaux d'acquisition et construira des pipelines automatisés pour générer, tester et optimiser la création à grande échelle. Le candidat doit être motivé par la mission de seconde chance, être AI-native, exceller dans un ou deux canaux (par ex. paid search, SEO ou marketing de canaux) et allier rigueur analytique, sens créatif et autonomie entrepreneuriale. Les exigences incluent au moins cinq ans d'expérience pratique en growth marketing avec preuve d'avoir mené des campagnes de bout en bout, d'avoir construit des workflows marketing pilotés par l'IA, d'avoir mené des projets de 0 à 1, et la disponibilité pour déménager et travailler en présentiel à New York. Les responsabilités comprennent la conduite de l'acquisition étudiante (paid search, paid social, SEO, partenariats, publicité hors ligne), la mise en place d'une attribution reliant dépenses aux inscriptions, et l'optimisation continue des canaux et créatifs. L'organisation vise à rompre le cycle de pauvreté et d'incarcération en fournissant des formations et des placements professionnels, affiche des résultats élevés (89% de diplomation, 92% d'emplois liés à la formation et revenu moyen de première année de 77 352 $) et s'appuie sur l'expérience des fondateurs issus d'Ameelio.

06:06

Microsoft's open source tools were hacked to steal passwords of AI developers

Microsoft a coupé l'accès à des dizaines de projets open source hébergés sur GitHub après avoir enquêté sur l'injection d'un logiciel malveillant visant à voler des mots de passe. Les projets touchés concernent notamment des outils liés à Azure et des extensions pour des environnements de développement IA comme Claude Code, l'interface en ligne de commande de Gemini et VS Code. Des firmes de sécurité comme Cloudsmith et OpenSourceMalware ont indiqué que le malware permettait de récupérer des identifiants lorsque les outils compromis étaient ouverts dans des applications de codage assisté par IA. Microsoft a confirmé la suppression temporaire de certains dépôts, précisant que certains ont été restaurés après vérification tandis que d'autres restent hors ligne et que un petit nombre de clients a été informé. Au moins 70 projets ont été désactivés selon GitHub et des chercheurs indiquent qu'il pourrait s'agir d'une réinfection d'un projet précédemment compromis, suggérant des problématiques persistantes de chaîne d'approvisionnement logicielle.