Avec le lancement de Grok 4.1, la société xAI d' Elon Musk affirme qu'elle est trois fois moins susceptible de fabriquer des informations et de faire passer des mensonges pour des faits

Le modèle d'IA le plus récent de xAI , la société d' Elon Musk spécialisée dans l' IA , s'appelle Grok 4.1.

Avec le lancement de Grok 4.1, la société xAI d' Elon Musk affirme qu'elle est trois fois moins susceptible de fabriquer des informations et de faire passer des mensonges pour des faits
Points forts
  • Grok 4.1 réduit nettement les hallucinations
  • Le modèle est plus performant et plus fiable
  • Grok 4.1 domine les benchmarks LMArena
Publicité

Grok 4.1, la dernière version du modèle d'intelligence artificielle xAI d' Elon Musk , est désormais disponible . L' entreprise affirme que Grok 4.1 présente de nombreux avantages par rapport à la version précédente, notamment un taux d'hallucinations presque trois fois inférieur .Le modèle d'IA le plus récent de xAI , la société d' Elon Musk spécialisée dans l' IA , s'appelle Grok 4.1. Musk a mis en avant les améliorations en termes de vitesse et de fiabilité lors de l'annonce de cette mise à jour sur son réseau social X. Selon xAI, cette nouvelle version de Grok réduit considérablement le risque d' hallucinations.Grok 4.1 retains the intelligence and dependability of earlier models while being "exceptionally capable in creative, emotional, and collaborative interactions," according to xAI's internal evaluations.

Après l' entraînement de Grok 4.1, xAI s'est concentré sur la réduction des erreurs liées aux requêtes de recherche d'informations afin de résoudre le problème des hallucinations factuelles . L' entreprise a utilisé le benchmark FACtScore , composé de 500 questions biographiques , ainsi que des requêtes réelles issues du trafic de production pour évaluer les taux d' hallucinations .

Grok 4.1 a enregistré un taux d'hallucinations de 4 %, soit trois fois moins que le modèle Grok 4 Fast ( 12 %). Grok 4.1 a obtenu un score de 9,89 % au test FACtScore , tandis que Grok 4.1 a reçu un score de 2,97 % .

Grok 4.1 a été évalué par xAI à l'aide de LMArena, une plateforme de référence fiable pour les grands modèles de langage (LLM). Grok 4.1 a obtenu le meilleur score global dans l'arène textuelle de LMArena avec un score Elo de 1483 , surpassant tous les autres modèles de 31 points . Grok 4.1 a obtenu un score supérieur à celui des autres modèles avec raisonnement complet , même en mode tenseur.

Grok 4.1 a démontré une nette préférence des utilisateurs avec un taux de victoire de 64,78 % lors de tests comparatifs directs avec le modèle de production précédent de xAI .
 

Publicité

Publicité

© Copyright Red Pixels Ventures Limited 2025. All rights reserved.
Trending Products »
Latest Tech News »