Seattle Shield, an intelligence-sharing network operated by the Seattle police
Resume indisponible pour cet article.
Edition quotidienne
Les meilleurs longs formats de Hacker News, relus plus calmement.
22 May 2026
06:03
Resume indisponible pour cet article.
22 May 2026
06:03
Les progrès des modèles de langage ont favorisé leur usage comme agents autonomes dans des tâches de codage et d'interaction informatique, tandis que le paradigme central reste celui des modèles ajustés par instruction de type chat. Ce format à flux unique de messages crée un goulot d'étranglement qui empêche l'agent d'agir pendant la lecture, de réagir à de nouvelles informations pendant l'écriture, de penser en agissant ou d'agir en pensant. La solution proposée consiste à ajuster les modèles pour plusieurs flux parallèles de calcul, en séparant chaque rôle (utilisateur, système, outils, etc.) dans un flux distinct. À chaque pas avant, le modèle lit simultanément plusieurs flux d'entrée et génère des jetons dans plusieurs flux de sortie, chaque flux dépendant causalement des étapes antérieures. Cette approche vise à lever les limitations d'usage, à améliorer l'efficacité par parallélisation, à renforcer la sécurité par séparation des responsabilités et à faciliter la monitorabilité.
22 May 2026
06:03
Resume indisponible pour cet article.
22 May 2026
06:02
Waymo a suspendu son service dans quatre villes après que ses robotaxis ont rencontré des difficultés face à de fortes pluies et des routes inondées, problème qui a déjà entraîné un rappel la semaine dernière. Un robotaxi non occupé de Waymo s'est retrouvé coincé pendant environ une heure dans une rue inondée à Atlanta, ce qui a poussé la société à arrêter le service en ville et à récupérer le véhicule. L'entreprise a également mis en pause les opérations à San Antonio, Dallas et Houston et a déployé une mise à jour logicielle imposant des restrictions temporaires dans les zones à risque, tout en reconnaissant qu'elle n'a pas encore de solution définitive pour éviter les zones inondées. Waymo dit s'appuyer notamment sur les alertes du National Weather Service pour préparer ses véhicules, mais l'entreprise a indiqué que des inondations massives peuvent se produire avant l'émission de ces alertes. Les incidents récents s'ajoutent à d'autres problèmes opérationnels en cours d'examen par la NHTSA et le NTSB, notamment des manœuvres illégales autour d'autobus scolaires et une collision en janvier avec un enfant à Santa Monica.
22 May 2026
06:02
Spotify a annoncé "Reserved", une fonctionnalité destinée à réserver des billets de concert pour les abonnés premium afin d'améliorer leurs chances d'achat. La plateforme, qui lancera le dispositif cet été aux États-Unis, s'est associée à Live Nation et utilisera les écoutes, partages et autres activités pour identifier les fans les plus engagés. Les fans sélectionnés pourront acheter jusqu'à deux billets pendant une fenêtre de 24 heures, mais Spotify précise que le nombre de places est inférieur au nombre de superfans et que tous ne recevront pas d'offre. Spotify n'a pas précisé quels artistes participeraient ni combien de billets seraient réservés par artiste, et l'efficacité du système pour faire obtenir des billets aux véritables fans reste à évaluer. La société a aussi présenté d'autres nouveautés, dont l'application Studio by Spotify Labs pour créer du contenu personnalisé et un accord de licence avec Universal Music Group pour autoriser des reprises et remixes par IA de certains artistes.
22 May 2026
06:02
Runtime est une plateforme d'exécution pour des agents de codage sandboxés qui intègrent le contexte, les outils et les garde‑fous propres à chaque entreprise. Elle permet de connecter tous les environnements et d'installer des CLI, API, services ou dépôts pour créer des sandboxes prêts à l'emploi et lancer des sessions en quelques secondes. Les équipes peuvent déployer des agents spécialisés — par exemple pour les incidents, la prospection commerciale ou le support — que l'on peut taguer depuis Slack, Linear, GitHub ou autres, et qui réalisent des enquêtes, ouvrent des PR, rédigent des réponses et publient leurs conclusions. La plateforme fournit une observabilité et une gouvernance en temps réel sur chaque session (appels d'outils, chaînes de raisonnement, modifications de fichiers), avec suivi des coûts, limites de dépenses, listes blanches et gates d'approbation, et n'autorise pas les écritures directes sur la production sans revue. Runtime peut être hébergé en cloud ou déployé sur l'infrastructure de l'entreprise avec ses propres modèles, sandboxes et secrets, propose de nombreux connecteurs (entrepôts de données, CRM, facturation, RH, alerting, etc.) et est disponible sous licence Apache 2.0.
22 May 2026
06:02
L'équipe présente Flipper One comme une plateforme Linux portable et modulaire visant à réinventer le concept de cyberdeck, avec des interfaces haut débit et un système d'extensions M.2 et GPIO. Le projet se fixe des objectifs ambitieux d'ouverture logicielle : support complet mainline du noyau Linux pour le SoC Rockchip RK3576, suppression des blobs binaires et documentation exhaustive en collaboration avec Collabora. L'architecture combine un processeur principal RK3576 (8 cœurs, GPU Mali, NPU, 8 Go de RAM) et un microcontrôleur RP2350 pour la gestion d'affichage, de l'alimentation et des entrées, reliés par SPI, I²C et UART. Côté logiciel, l'équipe développe Flipper OS pour gérer des profils système et FlipCTL, un cadre d'interface menu pour petits écrans, et prévoit un LLM local exploitant l'accélérateur NPU. Ils ouvrent un portail développeur public, invitent la communauté à contribuer (tests, code, docs, partenariats matériels) et reconnaissent les risques techniques et financiers tout en recrutant et en sollicitant de l'aide.
22 May 2026
06:01
À 5 h 29 min 45 s le 16 juillet 1945, la première détonation atomique a créé une boule de feu immense et aveuglante au‑dessus du bassin de la Jornada del Muerto au Nouveau‑Mexique. Des photographes dans des bunkers, notamment Berlyn Brixner, ont utilisé des caméras à grande vitesse pour saisir la toute première lumière et l'évolution de la boule de feu, y compris des images Fastax montrant un globe translucide à quelques centièmes de seconde. L'effort photographique a produit plus de 100 000 images mais seulement 11 des 52 appareils ont donné des clichés exploitables, permettant aux scientifiques de reconstituer l'explosion à partir d'angles et de cadences complémentaires. L'explosion a dépassé les prédictions, submergeant instruments et observateurs par une luminosité intense, une colonne de poussière montante et un champignon culminant à plusieurs kilomètres de hauteur. Des témoins, soldats et physiciens ont décrit le test comme saisissant, bouleversant et sans précédent dans l'expérience humaine.
22 May 2026
06:01
Resume indisponible pour cet article.
22 May 2026
06:01
L'inférence des grands modèles est limitée par la VRAM, la recomputation répétée des prompts et les boucles d'inférence peu optimisées. La solution fournit une intégration drop‑in pour HuggingFace qui réutilise au niveau des chunks le cache K/V, exploite FlashAttention‑2, permet le streaming de couches quantifiées AWQ et déplace dynamiquement des blocs K/V vers la RAM CPU. Sur du matériel réel, elle affiche des accélérations du temps jusqu'au premier token de 3–5×, des taux de hit du cache multi‑tours supérieurs à 80% et permet d'exécuter des modèles 32B sur des GPU à 8 Go grâce au streaming de poids. Le fonctionnement repose sur le hachage déterministe de chunks pour sauter l'attention sur les portions inchangées, l'utilisation de FlashAttention‑2 pour les nouveaux tokens et l'éviction asynchrone de blocs K/V vers la RAM sans modifier les modèles ni nécessiter de fine‑tuning. Le projet est open source sous licence MIT, s'installe via pip, dispose de documentation et d'un dépôt public, et prévoit d'ajouter parallélisme multi‑GPU, décodage spéculatif et support étendu (GGUF/GGML, kernels Triton) à l'avenir.