Un equipo de la Universitat Politècnica de València (UPV) ha participado en el desarrollo de una nueva metodología inteligencia artificial capaz de predecir si un modelo tendrá éxito en una tarea antes de ejecutarla.
El sistema, denominado ADeLe, logra un nivel de acierto cercano al 90% y sus conclusiones han sido publicadas en la revista científica Nature.
Metodología inteligencia artificial: predicción antes de ejecutar
ADeLe permite anticipar el comportamiento de los modelos de inteligencia artificial en tareas que aún no han realizado.
A diferencia de los métodos actuales, que solo analizan resultados tras una prueba concreta, esta herramienta evalúa las capacidades del sistema de forma previa.
Según el investigador de la UPV Fernando Martínez-Plumed, esta tecnología permite detectar fallos antes de que los modelos sean utilizados en entornos reales.

Un avance clave para empresas y regulación
Este desarrollo supone un avance relevante para empresas, reguladores y responsables políticos.
La herramienta permite evaluar los sistemas de IA antes de su lanzamiento, reduciendo riesgos y costes asociados a errores.
Además, facilita auditorías más rigurosas en un contexto donde la inteligencia artificial se está expandiendo rápidamente.
18 dimensiones para medir capacidades de la IA
El sistema organiza las capacidades de los modelos en 18 dimensiones cognitivas clave.
Entre ellas se incluyen la atención, el razonamiento o la complejidad de la tarea.
A partir de estas variables, ADeLe genera un perfil de capacidades que permite predecir el rendimiento del modelo en distintos escenarios.
Qué revela el estudio publicado en Nature
El estudio identifica varias conclusiones relevantes.
En primer lugar, señala que muchas pruebas actuales de IA no miden correctamente las capacidades que pretenden evaluar. También confirma que los modelos presentan fortalezas y debilidades distintas según su diseño y tamaño.
Además, demuestra que ADeLe puede predecir con precisión el éxito o fracaso en nuevas tareas.
Por último, concluye que el debate sobre si la IA puede razonar depende del nivel de dificultad de las pruebas utilizadas.









