HN Digest
Briefing personnel.

Edition quotidienne

Lire vite. Garder l'essentiel.

Les meilleurs longs formats de Hacker News, relus plus calmement.

5824 articles Page 524/583 Sans filtre

07:05

Crawling a billion web pages in just over 24 hours, in 2025

Cet article analyse l'évolution de l'art du crawling sur le web depuis 2012 et les nouveaux obstacles rencontrés par l'augmentation du contenu dynamique et du matériel. Il décrit un crawl massif visant environ un milliard de pages en une journée, mené sur 12 nœuds i7i.4xlarge pour un coût final d'environ 462 dollars. L'architecture est un cluster où chaque nœud intègre Redis, un ensemble de fetchers et de parsers, et gère une frontière des domaines en mémoire. Le parsing émerge comme le principal goulot d'étranglement et les gains surviennent grâce à l'adoption de selectolax et à la réduction du contenu des pages à 250 Ko. L'article met en avant la nécessité de respecter robots.txt et les limites opérationnelles et financières, tout en discutant des défis futurs liés au passage à du contenu web rendu dynamiquement.

07:05

What I learned designing a barebones UI engine

L’auteur a développé une couche UI sur PyGame destinée à ses expérimentations, en privilégiant la transparence des coûts et l’écriture rapide en Python, avec une boucle simple de hit-test, mise à jour et rendu. Pour progresser, il passe d'une liste plate à une architecture en arbre où les nœuds sont soit dédiés au layout soit au contenu et parcourus en profondeur. Le cœur expose measure() et distribute() pour mesurer et attribuer les tailles et positions des nœuds, sans contraintes et en s’appuyant sur des tailles intrinsèques. Des ajouts incluent l’asynchronie, les écouteurs d’événements et des optimisations de performance, ainsi qu’un système d’étapes (stages) pour naviguer entre les pages. L’objectif est de concilier simplicité et fonctionnalité, tout en envisageant des évolutions comme une API déclarative, la composabilité et un système de style personnalisable.

07:05

Git's Magic Files

Ces fichiers magiques voyagent avec le code et influencent le traitement des fichiers par git. Ils couvrent .gitignore, .gitattributes et .gitmodules, qui définissent respectivement les règles d’ignore, les attributs et les sous-modules. D’autres fichiers comme .mailmap, .git-blame-ignore-revs et .gitmessage ajustent l’identité des auteurs, le blâme et le modèle de commit. Des dossiers propres aux forges (par exemple .github, .gitea ou .forgejo) étendent git avec des configurations et flux CI spécifiques. Si vous développez des outils qui interagissent avec des dépôts, il faut lire et respecter ces fichiers pour adopter les mêmes pratiques et éviter les surprises.

07:05

How close are we to a vision for 2010?

Le texte rappelle qu'il y a vingt-cinq ans, le groupe ISTAG de l'UE publiait un document sur l'informatique ambiante et le rêve de l'informatique ubiquitaire. Il décrit quatre scénarios progressifs centrés sur Maria, Dimitrios avec son D-Me, Carmen et Annette et Solomon, montrant des usages allant du voyage personnel à l'apprentissage social à distance. Ces scénarios évoquent des technologies telles que des dispositifs personnels omniprésents, des infrastructures mobiles et fixes transparentes, des maisons et voitures connectées, des assistants multilingues et des systèmes de livraison et de paiement automatiques. Le texte met aussi en évidence les écarts avec la réalité actuelle, les limites de vie privée et sécurité, le manque de normes ouvertes et la question de la dépendabilité des systèmes. Il conclut que la réalisation de ces visions dépendrait d'investissements publics soutenus et de l'adoption de normes ouvertes, comme le souligne The Entrepreneurial State.

07:05

Fresh File Explorer – VS Code extension for navigating recent work

Cette extension facilite la navigation des changements récents et de l’historique Git en fonction du travail en cours. Elle organise les fichiers dans une arborescence intelligente avec regroupement par dossier, prise en charge des fichiers supprimés et coloration par carte thermique indiquant les modifications les plus récentes. Une section épingnée en haut permet de garder des éléments importants accessibles, indépendamment de ce qui est affiché dans la vue principale. Des notifications de synchronisation informent lorsque l’on est en retard ou en avance par rapport au dépôt ou à la branche de base, avec des options de désactivation. Des modes de regroupement variés, une recherche rapide et des actions du menu contextuel facilitent l’ouverture, la restauration ou l’exploration des fichiers.

07:04

Attention Media ≠ Social Networks

Au début, les réseaux sociaux basés sur le web étaient véritablement sociaux, permettant de suivre des proches et de recevoir des mises à jour réelles. Entre 2012 et 2016, l'expérience a changé avec l'apparition du défilement infini et des notifications de plus en plus manipulatrices qui ne servaient pas l'utilisateur. Au fil du temps, le fil d'actualités s'est rempli de contenus d'inconnus, donnant l'impression d'un haut-parleur bruyant qui propage des fragments de conversations sans substance. En revanche, Mastodon est apparu et rappelle les débuts de Twitter, permettant de suivre un petit nombre de personnes réellement intéressantes et de voir uniquement leurs mises à jour. Ainsi, l'auteur espère que cette expérience plus calme et centrée sur les choix personnels puisse persister et que les réseaux restent réellement sociaux.

07:04

Emulated Windows 3.11 in the Browser

Le document présente une section d'aide et un espace dédié aux idées et aux bugs, affilié à deux auteurs. Des boutons et indications affichent une option de plein écran ainsi que des messages de chargement et de téléchargement. Une représentation visuelle d'un clavier montre les touches et symboles, reproduisant la disposition QWERTY avec Échap, Tab, Caps Lock et Entrée. Le contenu répertorie aussi les groupes de touches comme Ctrl et Alt, ainsi que les touches de navigation et les flèches. L'ensemble semble être une interface utilitaire destinée à aider les utilisateurs à interagir avec le clavier et à signaler des idées ou des bugs.

07:04

Show HN: A geometric analysis of Chopin's Prelude No. 4 using 3D topology

GitHub propose une plateforme de développement qui intègre des outils d’intelligence artificielle pour écrire, construire et déployer des applications intelligentes. Elle offre des mécanismes pour gérer des prompts, intégrer des outils externes et automatiser les workflows via Actions et Codespaces. Des solutions de sécurité avancées, comme GitHub Advanced Security, aident à trouver et corriger les vulnérabilités et à protéger le code. Le portefeuille couvre toutes les étapes du cycle logiciel, du développement à la sécurité, en passant par la documentation et les ressources éducatives. L’offre comprend des solutions d’entreprise, des add-ons et un écosystème comprenant dépôts, marketplace et support.