Esta es una traducción no supervisada realizada por IA. Por favor, consulte la versión en inglés para el texto definitivo.
El cuello de botella actual en la inteligencia artificial no es el cómputo, sino la confiabilidad. Para los constructores e inversores, el "problema de la alucinación" ha permanecido como una sombra intratable sobre el escalado de los Modelos de Lenguaje Grandes (LLM). Los puntos de referencia convencionales (MMLU, HumanEval) miden la recuperación de conocimiento estático o la lógica estrecha, pero no logran predecir la ruptura del razonamiento en entornos de alta entropía y múltiples pasos.