HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

3702 articles Page 172/371 Sans filtre

07:03

Show HN: Gemini can now natively embed video, so I built sub-second video search

SentrySearch découpe des vidéos de dashcam en segments chevauchants, intègre chaque segment comme vidéo via le modèle Gemini Embedding et stocke les vecteurs dans une base locale ChromaDB. Une requête textuelle est elle aussi encodée dans le même espace vectoriel pour retrouver les segments les plus similaires, puis le meilleur résultat est automatiquement découpé et sauvegardé en tant que clip. L'outil s'installe depuis GitHub, demande une clé API Gemini, utilise ffmpeg pour le découpage et propose des commandes d'indexation et de recherche avec des options de durée, recouvrement et prétraitement. Le prétraitement (downscaling et réduction de la fréquence d'images) et la détection de frames immobiles réduisent le coût et la taille des uploads, tandis que l'indexation coûte environ 2,84 $/heure selon les paramètres par défaut. Les limites incluent une détection heuristique des frames immobiles, une sensibilité aux frontières de segments et le fait que Gemini Embedding 2 est en préversion, ce qui peut faire évoluer comportement et tarification.

07:03

Hypura – A storage-tier-aware LLM inference scheduler for Apple Silicon

Ce scheduler d'inférence pour Apple Silicon répartit les tenseurs de modèles entre GPU, RAM et NVMe en fonction des accès, des coûts de bande passante et des capacités matérielles, permettant d'exécuter des modèles plus gros que la mémoire disponible sans plantage. Pour les modèles MoE, seul un petit nombre d'experts est chargé à la demande depuis le NVMe via streaming, avec un cache de neurones et un suivi de co-activation qui réduisent fortement les E/S après warmup. Sur un Mac M1 Max 32 Go avec NVMe à ~5,1 Go/s, le système fait tourner un Mixtral 8x7B de ~31 Go à environ 2,2 tok/s et un Llama 70B de ~40 Go à ~0,3 tok/s, alors que l'approche naïve provoque des OOM. L'outil se compile depuis les sources avec Cargo et CMake, expose une API compatible Ollama pour servir des modèles en local et propose des commandes pour profiler le matériel, exécuter l'inférence et inspecter les plans de placement. Le point clé est qu'il n'introduit aucune perte de performance pour les modèles qui tiennent en mémoire et qu'il transforme des modèles autrement inexploitables en exécutables sans écrire sur le SSD, les accès NVMe étant uniquement en lecture pour éviter l'usure.

07:03

What happened to GEM?

GEM était une interface graphique précoce développée par Digital Research pour les PC compatibles IBM et plus tard pour l'Atari ST, conçue par les auteurs de CP/M et DR‑DOS et inspirée par des travaux venus de Xerox PARC. Apple a considéré GEM comme une copie du Lisa/Macintosh et a menacé DRI de poursuites, tandis que la version 8086 de GEM fut présentée à COMDEX en 1984 et commercialisée le 28 février 1985, devançant Windows 1.0 d'environ neuf mois. Sur PC, GEM n'a pas percé faute de logiciels disponibles, de performances médiocres sur les 8088 lents et après que DRI eut accepté de retirer certains éléments d'interface à la suite de pressions d'Apple, ce qui rendit la version PC moins conviviale et fut abandonnée en 1988. En revanche, GEM trouva un véritable foyer sur l'Atari ST où le processeur Motorola 68000 et le fait que l'interface était livrée en standard assuraient de bonnes performances et un écosystème logiciel plus riche. GEM survécut cependant comme bibliothèque graphique pour DOS (notamment dans Ventura Publisher), fut libéré en GPL par Caldera en 1999 donnant naissance à FreeGEM et OpenGEM, et reste aujourd'hui un élément de l'héritage de Gary Kildall.

07:02

A Compiler Writing Journey

Ce dépôt GitHub documente le parcours de l'auteur pour écrire un compilateur auto-compilant pour un sous-ensemble du langage C. Le projet propose des explications pratiques et des références théoriques limitées pour permettre aux lecteurs de suivre les étapes et comprendre les choix effectués. La série d'articles décrit de manière progressive la construction du compilateur, couvrant l'analyse lexicale, le parsing, la gestion des opérateurs, les structures de contrôle, les types, les pointeurs, les structs/unions/enums, le préprocesseur, l'optimisation et plusieurs backends. L'auteur a arrêté le développement d'acwj pour commencer un nouveau langage appelé alic. Du code et des idées ont été empruntés au compilateur SubC de Nils M. Holm (domaine public), le code source du dépôt est (c) Warren Toomey sous licence GPL3 et les documents non source sont (c) Warren Toomey sous licence Creative Commons BY-NC-SA 4.0.

07:02

Show HN: Email.md – Markdown to responsive, email-safe HTML

Vous avez reçu un code de confirmation à saisir dans votre fenêtre de navigateur pour vous connecter. Le code de confirmation est DFY-X7U. Si vous n'avez pas demandé cet e-mail, vous pouvez l'ignorer en toute sécurité. L'e-mail provient d'Acme Inc. et indique l'adresse 123 Main St. Un lien de désinscription est fourni pour arrêter la réception de ces messages si nécessaire.

07:02

Algorithm Visualizer

Resume indisponible pour cet article.