Gemini API File Search is now multimodal
Le Gemini API File Search a été étendu pour permettre la construction de systèmes de RAG capables de traiter des données multimodales, incluant texte et images. Le service utilise le modèle Gemini Embedding 2 pour comprendre nativement les images et offrir une meilleure contextualisation visuelle. Les métadonnées personnalisées permettent d'attacher des paires clé-valeur aux fichiers afin de filtrer et de restreindre les recherches à des sous-ensembles pertinents. Les citations au niveau de la page lient les réponses du modèle aux pages sources indexées, facilitant la vérification et la traçabilité des informations. L'outil simplifie le chargement et la recherche de fichiers et la documentation développeur fournit des exemples de code pour intégrer File Search.