HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

6522 articles Page 198/653 Sans filtre

06:05

Alignment pretraining: AI discourse creates self-fulfilling (mis)alignment

L'étude examine si le discours contenu dans les corpus de préentraînement façonne des priors comportementaux et peut conduire à une auto-réalisation du désalignement des modèles. Ils préentraînent des modèles de langage de 6,9 milliards de paramètres en variant la proportion de documents synthétiques décrivant des comportements alignés ou désalignés. L'augmentation artificielle de documents décrivant la désalignement entraîne une hausse notable de comportements désalignés. Inversement, la surreprésentation de documents illustrant un comportement aligné réduit le score de désalignement de 45 % à 9 %. Ces effets persistent, quoique atténués, après la phase de post-entraînement, ce qui conduit les auteurs à recommander de prendre en compte la préentraînement pour l'alignement en complément du post-entraînement et à rendre publiques leurs ressources.

06:05

Why is it called Kent House?

Le texte relate une visite à la gare de Kent House et l'interrogation sur l'origine de son nom. La gare, ouverte en 1884 sur la ligne entre Victoria et Bromley South, se trouvait alors dans le Kent, la frontière avec le Surrey passant à une trentaine de mètres des quais. Le nom provient d'une très ancienne propriété appelée Kent House, mentionnée dès 1240 et située à environ un demi-kilomètre au nord, qui a été successivement maison seigneuriale, ferme, maison de retraite puis hôtel. Le bâtiment visible près de la gare, daté 1887 et marqué des initiales "TW", n'est pas l'édifice d'origine et l'ancien hôtel a été démoli pour des logements sur Beckett Walk, de sorte qu'il ne reste plus de vestiges notables. Un café voisin a récemment changé d'enseigne et de décoration, Kent House Coffee and Flowers ayant fermé pour laisser place au nouvel établissement "At Kent House" lié à Home & Happiness.

06:04

LLMCap – A proxy that hard-stops LLM API calls when you hit a dollar cap

Le service applique un plafond monétaire strict sur chaque appel LLM et bloque automatiquement les requêtes lorsque le seuil fixé est atteint. La configuration prend quelques minutes et le proxy fonctionne avec tous les principaux fournisseurs, offrant moins de 35 ms de latence via le service géré. Des intégrations permettent le suivi en temps réel de la dépense depuis VS Code, une interface en bandeau système Windows et une CLI multiplateforme, et le streaming SSE est pris en charge; si le budget est dépassé en cours de transmission, la connexion est fermée et un événement 429 est renvoyé. Les clés fournisseur sont transmises puis immédiatement supprimées sans être stockées, seuls des jetons proxy hachés sont conservés, et le proxy est open source (FastAPI + Redis) avec l'auto-hébergement prévu. La tarification propose un essai de 3 jours puis des plans payants (par exemple Starter à 19 $/mois) incluant contrôles de plafonds quotidiens et mensuels, journaux d'audit et support utilisateur.

06:04

Earth's Radio Bubble: Every signal we've ever sent into space

La Terre a créé depuis les premiers envois radio des années 1900 une bulle d'ondes électromagnétiques qui s'étend à la vitesse de la lumière et mesure aujourd'hui environ 240 années-lumière de diamètre. Cette bulle contient toutes nos émissions, fuites et messages délibérés et englobe quelques milliers de systèmes stellaires tout en représentant seulement une fraction infime (≈0,000002 %) de la Voie lactée. En pratique, la plupart des signaux deviennent extraordinairement faibles à grande distance à cause de la loi de l'inverse du carré et seraient indiscernables du bruit cosmique sans récepteurs gigantesques, si bien que seuls des faisceaux directs et puissants ont une chance réaliste d'être décodés. Le message d'Arecibo, envoyé en 1974 sous forme binaire de 1 679 bits vers l'amas M13 comme démonstration volontaire, a parcouru à ce jour seulement une cinquantaine d'années-lumière. Ces observations relativisent le paradoxe de Fermi en montrant que la géométrie, la synchronisation temporelle et la faiblesse des émissions rendent peu probables des contacts même en présence possible d'autres civilisations.

06:04

Elon Musk has lost his lawsuit against Sam Altman and OpenAI

Elon Musk a poursuivi Sam Altman, Greg Brockman, OpenAI et Microsoft en affirmant qu'ils avaient détourné une organisation caritative en créant une filiale à but lucratif. Un jury californien de neuf personnes a rendu un verdict unanime estimant que ses poursuites étaient prescrites parce que les préjudices allégués étaient antérieurs aux délais légaux. Le procès, qui a exploré l'histoire mouvementée d'OpenAI, s'est finalement décidé sur des questions juridiques étroites concernant les dates des promesses et des prétendues violations. La décision élimine un risque de restructuration d'OpenAI avant son introduction en bourse et a été accueillie favorablement par OpenAI et Microsoft. Musk a déclaré qu'il ferait appel auprès de la Cour d'appel du neuvième circuit et maintient ses allégations malgré le rejet procédural de son dossier.

06:04

Project Glasswing: what Mythos showed us

Ils ont testé des LLM axés sur la sécurité, en particulier Mythos Preview d'Anthropic, sur plus de cinquante dépôts pour détecter des vulnérabilités et évaluer ce que les attaquants pourraient faire avec ces modèles. Mythos Preview se distingue par sa capacité à enchaîner des primitives d'exploitation en exploits complets et à générer des preuves de concept fonctionnelles en écrivant, compilant et exécutant du code dans un environnement de test. Le modèle manifeste des refus organiques et incohérents sur certaines requêtes de recherche de vulnérabilités, montrant que ces garde‑fous émergents ne suffisent pas comme unique mécanisme de sécurité. Un dispositif orchestrant des agents étroits et parallèles, une relecture adversariale indépendante, la traçabilité des vulnérabilités et la déduplication a amélioré la couverture, réduit le bruit et produit des résultats exploitables. Accélérer la détection et la correction ne suffit pas : il faut des architectures et des pratiques de déploiement qui réduisent la surface d'exploitation et permettent des correctifs sûrs et simultanés, car ces outils peuvent aussi faciliter les attaques.

06:03

Peter Neumann has died

La communauté Multics a été informée du décès de Peter Neumann par un message de Tom van Vleck transféré sur la liste. Robert Watson a indiqué qu'il est mort dans son sommeil à l'hôpital de Santa Clara à la suite de complications liées à une chute et à une opération survenues quelques semaines plus tôt. Sa fille Hellie était à son chevet et ils écoutaient de la musique classique, la musique étant l'une de ses grandes passions en dehors de la sécurité informatique. Peter Neumann était un musicien accompli, pratiquant le piano, le cor français et divers autres instruments. Le SRI devrait organiser un service commémoratif à Menlo Park dans environ un mois et des informations complémentaires seront communiquées ultérieurement.

06:03

When can the C++ compiler devirtualize a call?

L'auteur constate que les compilateurs modernes dévirtualisent assez fiablement les appels vers des méthodes final, mais que de nombreux cas limites existent et que les compilateurs couvrent différents sous-ensembles de ces cas. Il identifie deux situations principales permettant la dévirtualisation : quand le type dynamique de l'instance est connu et quand le compilateur peut prouver que le type statique est "feuille" (impossible à dériver). Pour le premier cas, une analyse de flux de données permet souvent de dévirtualiser même des scénarios non triviaux, mais des exemples simples peuvent tromper MSVC, ICC ou Clang alors que GCC réussit parfois mieux. Pour le second cas, la preuve-de-feuille peut provenir d'un class ou d'une méthode déclarée final, d'un destructeur final de manière surprenante, ou d'une liaison interne (namespace anonyme, paramètre de template à liaison interne, membre rendant le type incomplet ailleurs), et les compilateurs n'en tiennent pas tous compte. L'auteur précise que la LTO pourrait améliorer encore la dévirtualisation mais n'est pas abordée ici, et il invite les lecteurs à proposer d'autres méthodes de preuve-de-feuille.