Show HN: Gemini can now natively embed video, so I built sub-second video search
SentrySearch découpe des vidéos de dashcam en segments chevauchants, intègre chaque segment comme vidéo via le modèle Gemini Embedding et stocke les vecteurs dans une base locale ChromaDB. Une requête textuelle est elle aussi encodée dans le même espace vectoriel pour retrouver les segments les plus similaires, puis le meilleur résultat est automatiquement découpé et sauvegardé en tant que clip. L'outil s'installe depuis GitHub, demande une clé API Gemini, utilise ffmpeg pour le découpage et propose des commandes d'indexation et de recherche avec des options de durée, recouvrement et prétraitement. Le prétraitement (downscaling et réduction de la fréquence d'images) et la détection de frames immobiles réduisent le coût et la taille des uploads, tandis que l'indexation coûte environ 2,84 $/heure selon les paramètres par défaut. Les limites incluent une détection heuristique des frames immobiles, une sensibilité aux frontières de segments et le fait que Gemini Embedding 2 est en préversion, ce qui peut faire évoluer comportement et tarification.