Google's AI Overviews spew false answers per hour, bombshell study reveals
La startup Oumi a analysé 4 326 résultats générés par le modèle Gemini 2 et autant par Gemini 3 et a conclu que les réponses étaient exactes dans 85 % et 91 % des cas, respectivement. En extrapolant au volume de recherches attendu en 2026 (plus de 5 000 milliards), Oumi affirme que les AI Overviews génèrent des centaines de milliers de réponses fausses chaque minute, sans que les utilisateurs s'en aperçoivent. Le rapport relève aussi une détérioration des sources citées, le taux de réponses « non étayées » passant de 37 % avec Gemini 2 à 51 % avec Gemini 3, et montre que les résumés s'appuient parfois sur des sources douteuses ou facilement modifiables. Les éditeurs protestent que ces résumés placés en haut des résultats siphonnent les visiteurs et les recettes publicitaires tout en utilisant leur travail pour entraîner l'IA sans compensation ni contrôle éditorial. Google conteste l'analyse en critiquant le benchmark et la méthodologie d'Oumi, y compris l'emploi d'un modèle interne pour l'évaluation, et souligne que ses modèles Gemini respectent ses normes de qualité malgré des erreurs déjà constatées.