HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

3748 articles Page 166/375 Sans filtre

07:10

Fast regex search: indexing text for agent tools

Depuis grep (1973), les outils ont évolué vers des index syntaxiques et des LSP, mais les agents continuent d'utiliser des recherches par expressions régulières comme grep ou ripgrep pour fournir du contexte. ripgrep est nettement plus rapide que grep mais souffre d'un goulot d'étranglement majeur lorsqu'il doit parcourir l'intégralité d'immenses monorepos, ce qui dégrade les workflows agentiques. L'approche classique consiste à construire un index inversé de trigrammes pour limiter le sous-ensemble de fichiers à vérifier, ce qui accélère beaucoup les requêtes regex mais implique des compromis de taille d'index et de précision. Des solutions alternatives améliorent ce schéma, notamment les tableaux de suffixes, les postings enrichis par des masques probabilistes de type Bloom pour simuler des quadgrammes, et les sparse n-grams déterministes pondérés par fréquence pour réduire le nombre de consultations d'index. Pour minimiser la latence et préserver la confidentialité, l'indexation et l'interrogation sont effectuées côté client avec un format compact mmapable et des mises à jour basées sur l'état Git, ce qui augmente sensiblement l'efficacité des Agents sur de grands dépôts.

07:09

Personal Encyclopedias

L'année dernière, en rangeant 1 351 photos anciennes chez sa grand-mère, l'auteur a trié, scanné et regroupé des images couvrant plusieurs générations. L'auteur a interrogé sa grand-mère pour reconstituer l'ordre et le contexte des photos, puis a rédigé des pages encyclopédiques en local avec MediaWiki. Il a ensuite expérimenté avec des modèles de langage et des métadonnées EXIF pour générer automatiquement des brouillons et identifier lieux et personnes à partir de photos et vidéos. En combinant photos, exports de données (localisation, transactions, trajets, musique et messages) et modèles, il a produit des pages détaillées reliant événements, lieux et échanges personnels, constituant peu à peu une encyclopédie personnelle. Le projet a été publié en open source pour fonctionner localement et préserver les données personnelles, et l'expérience a permis de révéler, documenter et raviver de nombreuses histoires familiales.

07:09

Obsolete Sounds

Resume indisponible pour cet article.

07:09

End of "Chat Control": EU parliament stops mass surveillance

Le Parlement européen a rejeté de justesse la surveillance de masse automatisée des messages privés, refusant d'abord l'évaluation automatique d'images et de textes inconnus puis la proposition amendée lors du vote final. L'interdiction entraîne l'expiration le 4 avril d'une dérogation qui autorisait des entreprises américaines comme Meta, Google et Microsoft à scanner volontairement les messages privés, mettant fin à ces pratiques indiscriminées. Les autorités soulignent qu'il n'y a pas de vide juridique puisque la surveillance ciblée sur suspicion avec mandat judiciaire, l'analyse des publications publiques, le signalement par les utilisateurs et la suppression proactive de contenus restent possibles. Des rapports techniques et officiels ont montré les limites de la surveillance de masse, avec des études pointant la faiblesse d'algorithmes comme PhotoDNA, des taux d'erreur élevés, une forte proportion de faux positifs et la prédominance de signalements provenant d'une seule entreprise. Les négociations pour une réglementation permanente et une éventuelle obligation de vérification d'âge se poursuivent, et le Parlement ainsi que la société civile demandent des approches alternatives axées sur la sécurité par conception et le retrait ciblé des contenus illégaux.

07:09

How much precision can you squeeze out of a table?

L'interpolation permet d'estimer la valeur d'une fonction entre les points d'une table et des méthodes d'ordre supérieur offrent une précision supérieure à l'interpolation linéaire. Le théorème de Lagrange donne une majoration de l'erreur en supposant des valeurs tabulées exactes, mais en pratique l'erreur due à l'espacement h et l'incertitude δ des valeurs domine souvent. L'erreur d'interpolation d'ordre n s'exprime approximativement comme c·h^{n+1}+λ·δ, on choisit n de sorte que c·h^{n+1}<δ car au-delà l'amélioration est négligeable et λ croît rapidement avec n pour des points équidistants. Ainsi, pour des logarithmes avec h=10^{-3} l'ordre 4–5 suffit en pratique, pour le sinus avec h=0,001 et 23 décimales l'ordre 7 fournit neuf chiffres, et la précision limite est celle des valeurs tabulées. En conséquence, des espacements larges nécessitent à la fois des ordres d'interpolation plus élevés et des valeurs tabulées très précises, tandis que l'espacement uniforme rend les très hauts ordres contre‑productifs à cause de la croissance de λ.

07:09

PICO-8 platformer system: handling every notoriously difficult physics edge case

L'auteur a développé seul un système de physique pour un jeu de plateforme sur pico-8 et met le code à disposition sous licence CC0. Le système n'utilise pas de solveur global mais une approche dite de « push-forwarding » où un objet vérifie son déplacement et pousse en chaîne les objets mobiles si possible. Les mouvements sont découpés en pas d'un pixel et traités séparément sur chaque axe pour éviter les chevauchements et améliorer la précision. Les objets peuvent être portés par un "ground object", les pentes transfèrent les composantes de mouvement entre axes pour permettre de pousser des boîtes, et les plates-formes unidirectionnelles suivent des règles spécifiques d'activation. Des fonctionnalités optionnelles comme l'eau ajoutant une vélocité vers le haut sont incluses et l'auteur fournit une démo ainsi que le code pour exploration et réutilisation.

07:09

Judge blocks Pentagon effort to 'punish' Anthropic with supply chain risk label

Un juge fédéral de Californie a bloqué indéfiniment la décision du Pentagone visant à qualifier Anthropic de risque pour la chaîne d'approvisionnement et à rompre ses liens gouvernementaux, estimant que ces mesures violaient ses droits constitutionnels. La juge Rita Lin a écrit dans une décision de 43 pages que la mesure constituait des représailles pour la critique publique du gouvernement et a accordé un délai d'une semaine avant exécution pour permettre un appel. Le Pentagone avait pris la décision après qu'Anthropic eut refusé de supprimer des garde-fous empêchant l'utilisation de son modèle Claude dans des armes autonomes et la surveillance de masse, et avait ordonné aux agences de cesser d'utiliser le produit. Anthropic a salué le jugement, affirmant qu'il était susceptible de l'emporter sur le fond et que la désignation avait terni sa réputation et mis en péril des contrats importants. Le ministère de la Défense a soutenu qu'il nécessitait un accès illimité à Claude pour des usages militaires, et une contestation distincte des pouvoirs invoqués reste pendante devant un tribunal fédéral à Washington, DC.

07:08

An unstoppable mushroom is tearing through North American forests

Un champignon originaire d'Asie, le pleurote doré (Pleurotus citrinopileatus), s'est échappé de la culture et se propage maintenant dans les forêts d'Amérique du Nord et en Europe. Des recherches montrent que les arbres colonisés par ce pleurote présentent environ moitié moins de diversité fongique que les arbres non colonisés, ce qui indique qu'il concurrence les espèces locales. Les scientifiques s'inquiètent des conséquences imprévisibles sur la décomposition du bois, le cycle du carbone et les habitats dépendant du nécrobiome forestier. Face à cette invasion, des mycologues et des citoyens scientifiques clonent et préservent des souches locales comme le pleurote gris pour maintenir la diversité génétique et réimplanter des espèces natives. La conservation fongique gagne en reconnaissance — avec des centaines d'espèces ajoutées à la liste rouge de l'UICN — mais elle reste sous-financée et vulnérable aux introductions d'espèces exotiques et au changement climatique.