HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

3507 articles Page 330/351 Sans filtre

07:05

MDST Engine: run GGUF models in the browser with WebGPU/WASM

MDST Engine permet d’exécuter des modèles GGUF dans le navigateur via WASM et WebGPU pour une inférence locale et complète. Il permet de charger, affiner, exécuter et publier ses propres modèles GGUF dans Chrome, Safari ou Edge. Cet outil propose un IDE libre, sécurisé et collaboratif avec inférence intégrée en cloud et locale, qui synchronise et stocke les projets tout en garantissant le chiffrement de bout en bout et la conformité RGPD. On peut lancer des LLMs dans le navigateur en un clic, synchroniser des projets en temps réel via GitHub ou le système de fichiers local, et mesurer les performances localement avec un classement WebGPU. L’objectif est d’ouvrir un marché plus large pour GGUF en rendant l’inférence locale rapide et accessible à tous, tout en invitant chacun à contribuer et à tester les modèles et le leaderboard.

07:05

Colored Petri Nets, LLMs, and distributed applications

Les réseaux de Petri colorés (CPN) étendent les réseaux de Petri en permettant que les jetons portent des données, ce qui facilite la modélisation des systèmes avec état et peut s'accorder avec le typestate de Rust. Ils offrent des mécanismes de vérification formelle au moment du build grâce aux gardes et à la consommation/production multi-jetons, améliorant la sûreté des programmes concurrents. L'exemple du scraping web montre comment une transition peut joindre des jetons proxies disponibles et cibles prioritaires, avec des états de cooldown et des mécanismes de réessai avec backoff pour limiter les requêtes. Deux approches sont envisagées: une architecture basée sur PostgreSQL avec transactions pour assurer le mouvement des jetons et l'état partagé, ou une implémentation Rust en mémoire avec persistance éventuelle via un journal d'événements. La problématique du partitionnement et de l'évolutivité est discutée, avec des options comme l'archivage des états ou le partitionnement horizontal via des réseaux CPN composés de services distribués.

07:05

A header-only C vector database library

Cette bibliothèque C est légère et fournie sous forme d'en-tête unique pour le stockage et la recherche d'embeddings vectoriels de haute dimension, avec une prise en charge optionnelle du multithreading. Elle propose une interface pour créer et détruire des bases de données, ajouter ou supprimer des vecteurs, et effectuer des recherches k plus proches voisins avec différentes métriques (cosinus, euclidienne et produit scalaire négatif). La persistance permet de sauvegarder et charger les bases de données sur disque, et des allocateurs mémoire personnalisés peuvent être fournis avant l’inclusion du header. Le code peut être compilé en version mono-thread ou multi-thread en activant la macro VDB_MULTITHREADED, et il ne dépend que éventuellement de pthreads pour le multithreading. Le format binaire comprend un en-tête avec les dimensions et le nombre d’éléments, les vecteurs stockés sous forme de floats et leurs identifiants, les métadonnées n’étant pas sauvegardées, et la bibliothèque est distribuée sous licence Apache v2.0.

07:05

Windows NT/OS2 Design Workbook

Le répertoire contient une liste de fichiers au format DOC et PDF, classés par nom. Les fichiers affichent des tailles variées, allant de quelques dizaines de kilooctets à près d'un gigaoctet. La date associée est identique pour tous les éléments, indiquant le 27 mai 2022 à 05:43. Les formats DOC et PDF coexistent, reflétant des versions éditables et des documents finalisés. L’ensemble semble relever de documents techniques ou administratifs couvrant divers sujets sans thème unique évident.

07:04

Linear Representations and Superposition

À mesure que les LLMs gagnent en taille, en capacité et en ubiquité, l’interprétabilité mécanistique devient plus importante et l’article explore deux concepts fondamentaux. Le premier concept, l’hypothèse de représentation linéaire (LRH), propose que les concepts se présentent de manière approximativement linéaire dans l’espace d’embedding et dans l’espace de désembedding. Park et al. encadrent mathématiquement cette idée en traitant le modèle comme une boîte noire et en montrant que les représentations dans les deux espaces sont isomorphes, ce qui unit interventions et probes. Les auteurs vérifient empiriquement sur Llama 2 que divers concepts (par exemple le présent et le passé, l’anglais et le français) peuvent être représentés conformément à ce cadre. La seconde notion, la superposition, explique comment de nombreuses caractéristiques interfèrent dans des espaces de dimension limitée et montre que la non-linéarité et la sparsité permettent de gérer l’interférence, avec des structures régulières observées sur des sphères unitaires et soutenues par le lemme de Johnson-Lindenstrauss.

07:04

A review of M Disc archival capability with long term testing results (2016)

Le texte expose le problème de l’archivage à long terme face à la durée de vie limitée des technologies actuelles et aux défaillances matérielles éventuelles. Il décrit les enjeux pour les professionnels de l’image et du cinéma et explique que les solutions courantes reposent sur le transfert régulier des données vers de nouveaux supports et sur le RAID en centres de données. Il souligne que les DVD et les Blu-ray ne garantissent pas une pérennité durable et que même les archives nationales rencontrent des difficultés pour mettre en œuvre des méthodes fiables. Il présente la M-Disc comme une solution potentielle avec une couche d’enregistrement inorganique et une longévité revendiquée par les fabricants, bien que les tests cliniques ou indépendants donnent des résultats variables. L’auteur raconte un test personnel comparant un Blu-ray ordinaire et un M-Disc, montrant que le premier est détruit par les conditions extérieures tandis que le second paraît encore intact, mais sans certitude sur la lisibilité future.

07:04

Show HN: MOL – A programming language where pipelines trace themselves

MOL est le premier langage de programmation doté d’opérateurs de pipeline natifs et d’auto-tracing, conçu pour les pipelines IA/RAG. Il propose une traçabilité des flux de données et des types IA dédiés tels que Thought, Memory, Node, Document, Chunk et Embedding, avec des gardes d’intégrité et un contrôle d’accès au niveau du langage. Sa fonction phare est l’opérateur |> combiné à l’auto-tracing, qui produit une trace de pipeline et évalue les étapes sans configuration manuelle. L’installation est flexible: PyPI, Docker, installation depuis la source, support LSP pour VS Code et même un playground en ligne, avec transpilation vers Python et JavaScript. Il permet de décrire des pipelines RAG en une seule expression tout en assurant la sécurité et les contrôles d’accès côté langage.

07:04

Show HN: Off Grid – Run AI text, image gen, vision offline on your phone

C'est une suite d'IA complète et entièrement hors ligne qui tourne sur l'appareil et regroupe génération de texte, génération d'images, vision, transcription vocale et analyse de documents. Elle peut exécuter des modèles locaux variés et accepte des fichiers GGUF, avec des performances dépendant du matériel et de la configuration. La génération d'images se fait en local avec Stable Diffusion et accélération NPU sur Snapdragon, et la transcription vocale est réalisée sur l'appareil sans envoyer de données au cloud. L'installation est possible sur Android et iOS via APK ou build à partir du code, nécessitant Node.js 20+, Java JDK 17, Android SDK 36 et Xcode 15+ selon la plateforme. Le projet est open source, accompagné d'une documentation technique et de guides, et ne dépend pas du cloud ou d'abonnements, tout en sollicitant les contributions de la communauté.

07:03

Interference Pattern Formed in a Finger Gap Is Not Single Slit Diffraction

L’article présente une méthode simple pour observer un motif d’interférence en faisant passer la lumière à travers un très petit écart entre deux doigts, ou entre les arêtes d’une pince à ongles, avec des sources lumineuses usuelles. Il affirme que ce phénomène n’est pas expliqué simplement par une diffraction sur une fente unique, et que le cas des doigts revient à une diffraction sur un écran semi-infini. La périodicité du motif dépend de λ et de la distance d’observation et non directement de la largeur de l’écart; on peut estimer le premier maximum autour de x ≈ sqrt(L λ/2). Des expériences avec des arêtes de doigts ou de pince à ongles montrent que des sources incohérentes peuvent produire des interférences lorsque la source est spatialement limitée. L’auteur propose que la diffraction par un écran semi-infini offre une explication cohérente du motif observé, et affirme que la cohérence n’est pas nécessaire si la source est suffisamment réduite spatialement.