IBM Granite 4.1 family of models
IBM a publié la collection Granite 4.1 comprenant des modèles de langage de petite taille, ainsi que des modèles pour la parole, la vision, les embeddings et la modération, destinés aux usages en entreprise. La famille de modèles de langage dense, décodeur‑seul, est proposée en versions 3B, 8B et 30B et dépasse nettement les performances des modèles Granite 4.0, l'instance 8B égalant ou dépassant une version 32B Mixture‑of‑Experts sur des tâches d'instruction et d'appel d'outils. Les modèles ont été entraînés sur environ 15 000 milliards de tokens avec un affinage progressif vers des données techniques de haute qualité, des phases de fine‑tuning supervisé et un pipeline de reinforcement learning multi‑étapes, et peuvent gérer des contextes allant jusqu'à 512K tokens. La sortie multimodale inclut Granite Vision 4.1 optimisé pour l'extraction de tableaux, graphiques et paires clé‑valeur entraîné aussi sur le jeu ChartNet, Granite Speech 4.1 avec variantes multilingues et un modèle non autoregressif à haut débit, Granite Guardian 4.1 pour la détection de risques et Granite Embedding Multilingual R2 pour la recherche sémantique en plus de 200 langues. Tous les modèles Granite 4.1 sont distribués sous licence Apache 2.0, sont optimisés pour des runtimes open‑source (vLLM, SGLang, llama.cpp) et sont disponibles sur watsonx, Hugging Face et d'autres plateformes pour des déploiements modulaires et gouvernés en entreprise.