Ceci est une traduction non supervisée réalisée par une IA. Veuillez vous référer à la version anglaise pour le texte définitif.
Le goulot d'étranglement actuel de l'intelligence artificielle n'est pas le calcul, mais la fiabilité. Pour les constructeurs et les investisseurs, le « problème de l'hallucination » est resté une ombre insoluble sur la mise à l'échelle des grands modèles de langage (LLM). Les tests de référence conventionnels (MMLU, HumanEval) mesurent la récupération de connaissances statiques ou une logique étroite, mais ne parviennent pas à prédire la rupture du raisonnement dans des environnements à haute entropie et à étapes multiples.