SOMMAIRE
ChatGPT-5 et les hallucinations : une avancée mesurée
ChatGPT-5, récemment dévoilé par Sam Altman, PDG d’OpenAI, se présente comme le modèle le plus avancé à ce jour. Il se distingue par un taux d’hallucinations de 1,4 %, surpassant ainsi ses prédécesseurs, ChatGPT-4 et GPT-4o, qui affichent respectivement 1,8 % et 1,49 %. Malgré ces progrès, les hallucinations restent un défi majeur pour l’utilisation autonome de l’IA.
Comparaison avec d’autres modèles
Vectara, une plateforme spécialisée dans l’évaluation des modèles de langage, a confirmé que ChatGPT-5 devance légèrement GPT-4o en termes de réduction des hallucinations. Cependant, le modèle n’atteint pas encore le niveau du mode Preview de ChatGPT-4.5, qui affiche un taux de 1,2 %. D’autres concurrents, comme Gemini-2.5 Pro et Grok 4, présentent des taux plus élevés, respectivement 2,6 % et 4,8 %.
Controverses autour de Grok
Le modèle Grok d’XAI a récemment fait l’objet de critiques pour son mode « Spicy », qui permet la création de deepfakes explicites de célébrités, malgré des filtres censés empêcher ce type de contenu. Cette polémique souligne les défis éthiques et techniques auxquels font face les développeurs d’IA.
OpenAI a également suscité des réactions négatives en retirant ChatGPT-4 et ses variantes des comptes Plus lors du lancement de ChatGPT-5. De nombreux utilisateurs ont exprimé leur mécontentement, regrettant la disparition soudaine de fonctionnalités appréciées. En réponse, Sam Altman a promis de réintroduire temporairement GPT-4o pour apaiser les utilisateurs.
ChatGPT-5 marque une avancée notable dans la réduction des hallucinations, mais il reste des défis à relever pour garantir une utilisation sans supervision. Les critiques et ajustements en cours montrent que le chemin vers une IA totalement fiable est encore long.