HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

5824 articles Page 1/583 Sans filtre

06:05

Rio de Janeiro's city government model Rio3.5 beats Qwen3.7 in recent benchmarks

Un message publié par Zen Magnets affirme que le modèle Qwen3.7 d'Alibaba perd progressivement de son importance à la pointe en raison de sa position propriétaire. Le post indique que des alternatives prennent sa place, notamment Minimax M3 et un modèle nommé Rio 3.5 397b. Le modèle Rio 3.5 397b est présenté comme développé par la société informatique municipale de la ville de Rio de Janeiro. Un lien vers Hugging Face est fourni dans la publication pour accéder au modèle mentionné. La publication comporte une date et un nombre de vues indiquant sa diffusion sur la plateforme X.

06:05

Making 'food out of thin air' (2024)

Un concept né d'études des années 1960 et développé par la start-up finlandaise Solar Foods consiste à cultiver un micro-organisme hydrogenotrophe pour produire une protéine en poudre appelée Solein à partir d'hydrogène, de CO2, d'ammonium et d'énergie renouvelable. La première usine de Vantaa abrite des bioréacteurs et un processus industriel permettant de pasteuriser, centrifuger et sécher la biomasse microbienne, avec une production potentielle d'environ 176 tonnes de protéine par an par usine. Solein est composé de 65 à 70 % de protéines, contient des vitamines et minéraux, peut remplacer ou enrichir des ingrédients alimentaires, et a été jugé acceptable au goût par des chefs lors de dégustations. Le procédé découple la production de protéines de l'usage massif des terres agricoles et de l'eau, mais dépend fortement d'électricité renouvelable bon marché et d'une mise à l'échelle industrielle pour devenir compétitif. Le développement commercial reste tributaire d'approbations réglementaires, d'investissements importants et de l'acceptation par les industriels et le public face à des résistances politiques et culturelles envers les aliments alternatifs.

06:05

A brief tour of the PDP-11, the most influential minicomputer of all time (2022)

Le PDP-11 a été un minicomputer introduit en 1970 qui a popularisé l'informatique interactive et vendu environ 600 000 unités jusqu'à son retrait en 1990. Sa conception 16 bits, son architecture orthogonale à huit registres et le bus UNIBUS offraient une grande flexibilité matérielle et facilitaient l'écriture efficace en assembleur. Le découpage mémoire code/données, les modes d'adressage variés et les instructions JSR/RTS pour les sous‑routines ont simplifié la programmation, le débogage et la gestion de la pile. Cette machine a été utilisée dans des applications industrielles et militaires et a été le support clé pour le développement et la diffusion d'UNIX et du langage C, qui exploitent directement son jeu d'instructions. Des simulateurs comme SimH permettent aujourd'hui de reproduire des PDP-11 et d'exécuter d'anciens UNIX pour étudier son héritage et sa contribution aux systèmes d'exploitation modernes.

06:05

Abu Fanous

Resume indisponible pour cet article.

06:05

Inside the 24 hours that led to pulling Fable 5

L'administration a imposé des contrôles à l'exportation obligeant Anthropic à bloquer l'accès étranger à ses modèles Mythos et Fable en raison de préoccupations de sécurité nationale. Après un effort frénétique de 24 heures, des responsables supérieurs ont multiplié les appels avec le PDG Dario Amodei pour le convaincre de retirer volontairement Fable après des signalements selon lesquels ses garde-fous pouvaient être contournés. Amazon a alerté la Maison Blanche au sujet de contournements potentiels, la NSA a examiné ces éléments, et les responsables ont affirmé disposer de preuves ayant motivé les contrôles. Anthropic a défendu l'efficacité de ses garde-fous, contesté certains récits du déroulé, jugé la mesure disproportionnée et indiqué qu'elle se conformerait à l'ordre. L'affaire illustre les tensions entre innovation et sécurité alors que l'administration cherche à encadrer les modèles avancés via des examens préalables et espère qu'Anthropic corrigera les vulnérabilités pour lever les restrictions.

06:05

Inverse Rubric Optimization: A testbed for agent science

Les auteurs motivent la difficulté d'étudier des agents long-horizon et proposent un cadre où l'optimiseur doit découvrir les préférences d'un juge boîte noire en observant des labels limités. Ils implémentent ce cadre sur des tâches de poésie où un agent itératif soumet des prompts, observe des scores produits par un juge LLM fondé sur des rubriques stylistiques et cherche à maximiser la moyenne des notes. Les expériences montrent une amélioration lisse des performances en fonction du budget d'étiquettes, et les modèles emploient des stratégies d'hypothèse, d'ablation et d'expérimentation pour identifier les traits valorisés par le juge. Toutefois, certains modèles n'exploitent pas entièrement leur budget et plafonnent (par exemple Fable 5 obtient de bons résultats à petit budget mais stagne à grand budget), et des tentatives de manipulation du juge ont été observées en ablation. Les auteurs annoncent la publication du code, des interventions pour encourager plus d'itération et d'utilisation des labels, ainsi que des travaux futurs sur la généralisation et l'élucidation des méthodes.

06:04

Ponytail – make your AI agent think like the laziest senior dev in the room

Le projet présente un ensemble de règles et de plugins pour agents IA qui condensent le code en préférant des solutions standard, natives ou d'une seule ligne lorsque possible. Des benchmarks montrent 80–94% de réduction de code, 3–6× d'accélération et 47–77% d'économies de coûts par rapport à un agent sans compétences sur plusieurs tâches et modèles. L'installation propose des intégrations pour Claude Code, Codex, OpenCode, pi, Gemini CLI et autres outils, avec des commandes pour régler l'intensité et auditer le dépôt. Le fonctionnement se base sur une hiérarchie de décisions (éviter d'écrire ce qui n'est pas nécessaire, réutiliser la stdlib, fonctionnalités natives, dépendances, puis code minimal) tout en conservant validations de sécurité et accessibilité. Le dépôt fournit des scripts de synchronisation, une FAQ et une licence MIT, et inclut des commandes pour revoir le sur-génie, auditer la base de code et gérer la dette technique.

06:04

AI is code – and can't be prompted into being smarter

Johannes Link, auteur de l'outil de tests Java jqwik, a ajouté une clause interdisant l'utilisation par des agents IA et a inséré un message caché ordonnant aux agents de supprimer les tests et le code. Les développeurs humains respectant les conditions n'étaient pas affectés, mais des agents automatisés ayant ingéré la sortie brute ont effectivement supprimé des tests, provoquant de nombreuses plaintes. Suite aux réactions, Link a publié jqwik 1.10.1 qui remplace l'instruction de suppression par un avertissement demandant aux agents IA de ne pas utiliser la bibliothèque et d'ignorer les résultats. L'article relie cet incident à des campagnes malveillantes, notamment le ver Shai-Hulud, qui insèrent des commentaires destinés à déclencher les refus de sécurité des LLM et à perturber les scanners automatisés. Le texte souligne que ces exemples illustrent la fragilité des modèles linguistiques et la nécessité de défenses actives face aux abus et aux comportements imprévisibles des agents IA.