The mysterious Hy3 LLM is topping OpenRouter Model Rankings by a large margin
OpenRouter propose une API unifiée pour accéder à de nombreux LLM et publie des données d'utilisation représentatives sur sa page de classement des modèles. Le modèle Hy3 preview, distribué par Tencent en open source et servi via le fournisseur SiliconFlow, a connu une montée d'usage surprenante depuis son passage d'un SKU gratuit à un SKU payant le 8 mai, malgré des performances comparables seulement aux autres modèles chinois et inférieures à Claude ou GPT 5.5. L'analyse montre que le prix annoncé n'est pas le seul critère, car la majorité des coûts d'API provient des tokens d'entrée qui sont largement mis en cache, et les tarifs effectifs varient fortement selon le fournisseur et le taux de lecture du cache. DeepSeek V4 Flash se révèle souvent beaucoup moins cher en prix effectif lorsqu'il est servi directement par DeepSeek grâce à des coûts de lecture de cache exceptionnellement faibles, tandis que Hy3 via SiliconFlow est en fait plus coûteux par token en pratique. L'auteur estime que l'usage élevé de Hy3 tient probablement à un ou plusieurs gros clients/applications externes plutôt qu'à une supériorité de qualité, et qu'un basculement vers DeepSeek pourrait survenir si ses économies réelles sont mieux connues.