HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

5917 articles Page 504/592 Sans filtre

07:03

From Noise to Image – interactive guide to diffusion

Le texte expose l'immense éventail d'images possibles, estimé à environ un 1 suivi de 400 000 zéros. La grande majorité de ces images n'est que du bruit et on peut voir jusqu'à 60 images aléatoires par seconde selon l'ordinateur. Les modèles de diffusion partent du bruit et le retirent progressivement pour faire émerger une image cohérente, contrairement à la création humaine qui part d'une toile vierge. Ils opèrent dans un espace latent plus petit que l'espace des images et utilisent un encodeur-décodeur pour passer du latent aux images réelles, tandis que les prompts textuels sont mappés dans un espace d'embedding. Le processus est régulé par le seed aléatoire, la longueur du prompt, le nombre d'étapes d'inférence et l'échelle de guidage qui influencent précision et style.

07:03

Running a One Trillion-Parameter LLM Locally on AMD Ryzen AI Max+ Cluster

L’article présente un cluster d'inférence distribué sur quatre nœuds utilisant la plateforme AMD Ryzen AI Max+ pour exécuter un modèle de près d’un trillion de paramètres via llama.cpp RPC. Le matériel utilisé comprend quatre Framework Desktop avec Ryzen AI Max+ 395 et 128 Go de RAM chacun, connectés par Ethernet à 5 Gbps. Une étape clé consiste à étendre la VRAM via une modification TTM à 120 Go par nœud, soit 480 Go au total, après configuration BIOS et redémarrage. Deux options d’installation de llama.cpp sont présentées: Lemonade SDK pré-builts ROCm et une construction manuelle à partir de ROCm 7. L’orchestration RPC rend le cluster équivalent à un seul accélérateur, avec rpc-server sur les nœuds secondaires et des commandes llama-cli ou llama-server pour lancer Kimi K2.5, en tirant parti du Flash Attention et des réglages n_batch et n_ubatch.

07:02

747s and Coding Agents

L’auteur raconte une conversation avec un pilote belge de 747 qu’il a rencontré lors d’un vol. Le pilote évoque qu’après un certain temps, il n’y a plus d’amélioration et qu’on connaît le 747 aussi bien que possible. L’auteur explique ensuite comment son travail a changé avec l’arrivée des agents de codage basés sur l’IA, capables d’effectuer une grande partie de ses tâches. Il décrit sa transition vers une approche où l’agent peut développer une fonctionnalité de bout en bout, ne nécessitant plus son intervention initiale. Il affirme que le gain réside surtout dans les connaissances du domaine et le raisonnement critique, et que laisser les agents prendre les solutions entières peut affaiblir ses compétences, tout en reconnaissant que ces outils sont là pour durer.

07:02

Unsloth Dynamic 2.0 GGUFs

Une mise à jour majeure de quantification dynamique permet d’exécuter et de fine-tuner des LLM quantisés tout en préservant la précision. La méthode ajuste dynamiquement le type de quantification pour chaque couche et s’applique à tous les modèles, avec des formats Q4_NL, Q5.1, Q5.0, Q4.1 et Q4.0. Un ensemble de calibration plus riche et un cadre d’évaluation interne permettent des comparaisons équitables, avec des mesures MMLU à 5 coups et divergence KL comme indicateurs principaux. Des benchmarks et répliques, notamment Gemma 3 QAT et des correctifs Llama 4, démontrent des gains de précision et une réduction de taille par rapport aux versions précédentes. Les versions futures utiliseront Dynamic 2.0 et 4 bits sûrs, et les déploiements se font sur des moteurs comme llama.cpp et LM Studio.

07:02

The Eternal Promise: A History of Attempts to Eliminate Programmers

Depuis les années 1950, l'informatique voit se répéter des promesses de simplification qui visent à réduire ou supprimer le besoin de programmeurs. Chaque vague — COBOL, les systèmes experts, les 4GL, les CASE, le web, MDA et les plateformes no-code/low-code — a suscité l'espoir d'une démocratisation du développement sans codage, mais a aussi créé de nouveaux métiers et de nouvelles formes de complexité. L'article affirme que transformer des intentions humaines en logiciel reste fondamentalement difficile et que l'essentiel n'a jamais été de taper du code, mais de spécifier et concevoir correctement les systèmes. Les outils qui simplifient certaines tâches déplacent la complexité vers la conception, l'intégration et l'architecture, maintenant ainsi une demande continue pour des développeurs compétents. En somme, l'avenir des développeurs inclura moins de code direct mais davantage d'expertise, et la valeur durable réside dans la compréhension des besoins, la conception, la maintenance et la prise de décision.

07:02

Deterministic Programming with LLMs

Cet essai explore comment les LLMs peuvent être utilisés de manière déterministe dans le développement logiciel. En mathématiques, les LLMs peuvent écrire des preuves ressemblant à des documents existants et leur fiabilité demeure incertaine, d'où l'adoption de systèmes de preuve formels comme Lean. Dans le domaine de la programmation, les IA peuvent aider à coder et déployer, mais leurs sorties ne sont pas totalement reproductibles et dépendent du contexte. Pour les tâches répétitives et critiques, il faut privilégier des outils déterministes tels que des linters, des tests et des vérifications du compilateur afin d'assurer la conformité. La solution préconisée est de coder les politiques dans des programmes déterministes et d'utiliser ces outils pour vérifier le respect des règles, en s'appuyant sur les LLMs pour générer ces outils plutôt que le code déterministe lui-même.

07:02

The archivist preserving decaying floppy disks

Un article explique les efforts pour préserver les données des disquettes et éviter une perte historique due au déclin des supports magnétiques. Leontien Talboom, archiviste à la Cambridge University Library, travaille avec des passionnés de rétroinformatique pour récupérer des données sur des disquettes. Dans le cadre du projet Future Nostalgia, elle a aidé à publier un guide d’imagerie des disquettes nommé Copy That Floppy pour aider les archivistes et les amateurs. Comme les disquettes existent en plusieurs formats et tailles, l’imagerie nécessite des contrôleurs et des méthodes adaptés à chaque type. Le processus consiste à lire les flux magnétiques et à reconstruire les données, qui peuvent inclure des courriels, des brouillons, des photos et des modèles 3D, préservant ainsi une partie de l’histoire numérique.