HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

5917 articles Page 85/592 Sans filtre

06:07

Show HN: Zot – Yet another coding agent harness

Cet agent minimal en ligne de commande est distribué comme un unique binaire Go statique sans runtime ni dépendances externes et se concentre sur la boucle d'assistant pour éditer du code et exécuter des commandes shell. Il prend en charge une large palette de fournisseurs de modèles (Anthropic, OpenAI, Google Gemini, GitHub Copilot, Bedrock, Hugging Face, Mistral, etc.) ainsi que des endpoints locaux compatibles OpenAI, avec gestion des clés via /login et un catalogue de modèles unifié et extensible. Quatre modes d'exécution existent (TUI interactive, sortie finale pour pipelines, NDJSON pour scripts, et RPC long-lived) et l'outil propose des fonctions intégrées read/write/edit/bash, un mode /jail et un système de confirmation des outils (--no-yolo) pour limiter les opérations dangereuses. Il supporte des extensions externes via un protocole JSON-RPC, des compétences par dossier (SKILL.md), la persistance de sessions/transcripts avec compactage et export/import, ainsi qu'un système de sous-agents "swarm" pour exécuter travaux parallèles partageant le même répertoire de travail. Des fonctionnalités additionnelles incluent un mécanisme de secours de modèle en cas d'erreur, réglages persistants (niveau de réflexion, rendu d'images), intégration Telegram, API d'embedding et des options d'installation multiplateformes (scripts, go install ou archives précompilées).

06:07

Real-time LLM Inference on Standard GPUs: 3k tokens/s per request

Kog AI publie un aperçu technique du Kog Inference Engine montrant 3 000 tokens/s par requête sur un nœud 8× AMD MI300X et 2 100 tokens/s sur 8× NVIDIA H200 en FP16 sur un modèle 2B (sans décodage spéculatif). L'équipe souligne que, pour les agents autonomes, la métrique critique est la vitesse de décodage par requête (latence de génération de tokens) plutôt que le débit agrégé ou le temps au premier token. À petit lot, le goulot d'étranglement principal est la bande passante mémoire effective (HBM) plutôt que les FLOPS, car le décodage autoregressif est dominé par des opérations matrice‑vecteur à faible intensité arithmétique. Les piles d'inférence standard gaspillent des microsecondes en lancements de kernels, synchronisations et communications inter‑GPU, et Kog réduit ces pertes par une conception conjointe du modèle, du runtime et du code GPU (monokernel, collectives KCCL, architecture Laneformer et optimisations topologiques). En conservant l'aperçu sans quantification ni techniques multi‑token, Kog montre la faisabilité d'atteindre des milliers de tokens/s sur du matériel datacenter courant et estime qu'avec plus de bande passante HBM et maturation du logiciel les grands modèles MoE pourraient atteindre 1 000–5 000 tokens/s par requête.

06:07

CAPTCHAs can still detect AI agents

Les CAPTCHAs modernes peuvent être résolus par des modèles VLM, mais les agents n'exécutent pas les tâches de la même façon que les humains, avec des différences statistiques dans les motifs de clics et de décision. Les auteurs présentent CogCAPTCHA30, une batterie de 30 tâches combinant le CAPTCHA classique et 29 tâches de psychologie cognitive pour étudier les processus plutôt que seulement les performances. Les expériences montrent que la performance (output) peut être équivalente entre humains et agents tandis que les caractéristiques de processus sont distinctes et non corrélées avec l'équivalence de sortie. Les modèles de pointe comme GPT, Claude et Gemini sont moins proches des humains dans l'espace des caractéristiques de processus que certains modèles plus petits ou entraînés sur des données comportementales humaines, comme Centaur. Un affinage direct des processus peut rendre un agent plus humain si celui-ci a accès aux caractéristiques et à l'objectif du discriminateur, mais la capacité à généraliser cross-tâche reste limitée, ce qui rend la "Process Turing Test" potentiellement robuste pour la vérification humaine.

06:06

High Density Living, 2000 Years Ago: Inside the Roman Apartment Building

Les insulae étaient des immeubles d'habitation pluriels et souvent surpeuplés à Rome, illustrés par l'épitaphe de l'ex-esclave Ancarenus Nothus et répondant à une forte demande de logements urbains. Ces bâtiments, parfois hauts de plusieurs étages, empruntaient des éléments à la domus (atrium, boutiques en rez-de-chaussée) mais introduisaient aussi des innovations comme des escaliers communs, des arcades voûtées, des balcons et des espaces à usages mixtes. L'invention du béton romain, obtenu en mêlant chaux et cendres volcaniques, permit la construction de structures monumentales et d'insulae plus résistantes, mais les limites des matériaux (absence d'armature métallique) et des techniques rendaient les immeubles vulnérables aux incendies et aux effondrements, ce qui conduisit après le grand incendie de 64 ap. J.-C. à des règles de reconstruction et à des limites de hauteur. La vie quotidienne était marquée par des risques et des inconforts — étages supérieurs mal isolés et infestés, absence de protections juridiques robustes pour les locataires, pratiques sanitaires défaillantes et taxes comme celle sur l'urine — soulignés par des témoins antiques tels que Juvenal, Cicéron et les lois postérieures. Les insulae mieux construites d'Ostie, avec leurs façades en briques, leurs mosaïques et leurs appartements de standing, montrent que ces immeubles pouvaient offrir un habitat dense, mixte et praticable, même si la dégradation environnementale et le déclin du port entraînèrent l'abandon et le démantèlement de beaucoup d'entre eux.

06:06

The California state assembly has passed the 'Protect Our Games Act'

Le mouvement "Stop Killing Games" a poussé à une avancée législative aux États-Unis en demandant que les joueurs puissent continuer à accéder aux jeux après la fin d'un service en ligne. L'Assemblée de Californie a adopté le projet de loi AB 1921, dit "Protect Our Games Act", par 43 voix contre 16, obligeant les éditeurs de jeux numériques à maintenir un accès aux jeux après la cessation de service. À partir des jeux vendus ou revendus après le 1er janvier 2027, la loi exigerait un préavis d'au moins 60 jours et l'offre d'une version alternative ou d'un correctif, ou bien un remboursement si l'accès ne peut être assuré, tout en excluant les services par abonnement, les jeux free-to-play et les titres jouables hors ligne indéfiniment. Le texte interdit également la vente continue de jeux devenus inutilisables suite à la fermeture de serveurs et suscite l'opposition de l'ESA pour des raisons de sécurité et de propriété intellectuelle, tandis que les groupes de préservation le défendent comme protection du patrimoine culturel. Le projet doit encore être approuvé par le Sénat californien et signé par le gouverneur, mais son adoption en Californie pourrait avoir un impact symbolique et pratique sur les politiques des éditeurs de jeux aux États-Unis.

06:06

Free full BGP feed. IPv4 and IPv6 (2020)

L'auteur a étendu son projet de partage de flux BGP complet pour inclure l'IPv6 en réponse aux demandes des lecteurs. Il prévient que l'utilisation se fait à vos risques et périls, qu'il peut interrompre le service à tout moment et qu'il ne sera pas responsable des effets sur votre équipement. Les instructions indiquent d'établir une session eBGP multihop sans mot de passe, avec l'ASN côté client 65001 (ou local-as 65001 si impossible), l'ASN distant 57355, timers 3600/7200 et adresses 85.232.240.179 pour IPv4 et 2001:1A68:2C:2::179 pour IPv6. Des exemples de configurations pour Cisco IOS/IOS‑XE et IOS XR sont fournis, incluant l'activation des familles d'adresses, des filtres en sortie (deny-all) pour éviter l'envoi de préfixes et quelques optimisations TCP recommandées. La seule différence avec la session précédente est l'utilisation d'un ASN public et l'ajout de l'acheminement IPv6, le reste restant inchangé.

06:06

We should be more tired than the model

L'auteur décrit une sensation de perte de contrôle quand il utilise la génération d'agents, obtenant des résultats visibles sans les processus cognitifs internes habituels. Il rappelle que la mémoire humaine comprend la mémoire à court terme, la mémoire de travail et la mémoire à long terme, la mémoire de travail synthétisant les informations pendant la lecture ou l'écriture de code. Il soutient que la génération automatique de code, par ses effets d'interface proches d'une machine à récompense, est contraire à la rétention de compétences et favorise une dépendance au modèle. Pour y remédier, il adopte des stratégies qui réintroduisent de la friction : écrire l'implémentation initiale soi-même, demander une revue à l'agent et appliquer manuellement les commentaires, poser des questions ciblées, comparer approches, discuter avec une autre personne, attendre avant d'utiliser l'agent, relire des ouvrages et réimplémenter des structures de données. Il conclut que ces pratiques ralentissent le travail à court terme mais renforcent à long terme la maîtrise personnelle et l'usage délibéré de l'outil en consolidant sa propre base de connaissances plutôt que celle des modèles.

06:05

GTA 6 Developers Unionize

Le syndicat Independent Workers’ Union of Great Britain et des employés de Rockstar ont annoncé la création du Rockstar Game Workers Union, affilié à l'IWGB. Ils ont publié une vidéo informative exposant leurs motifs et indiquant que des salariés des bureaux d'Édimbourg, Londres, Leeds, Lincoln et Dundee se sont rassemblés. Le syndicat entend engager une procédure judiciaire contre Rockstar après la mise à pied de plus de 30 employés pour « faute grave », que le syndicat qualifie de pratique anti‑syndicale. Une date d'audience a été fixée mais n'a pas été communiquée, et des élus ont accusé Rockstar de faire obstacle aux procédures juridiques en cours. Les revendications incluent la transparence salariale, le télétravail flexible et la fin du crunch, et le syndicat a créé des comptes sur les réseaux sociaux ainsi qu'une page de dons pour financer la bataille judiciaire.