La nueva IA basada en el cerebro humano supera a ChatGPT

El campo de la inteligencia artificial experimenta un nuevo punto de inflexión cada día. La competencia en el mundo de la IA ya no se limita al número de parámetros ni a la cantidad de datos utilizados. Un desarrollo reciente lo demuestra.
UNA NUEVA INTELIGENCIA ARTIFICIAL QUE RAZONA DE FORMA DIFERENTE A LA MAYORÍA DE LOS PRINCIPALES MODELOS DE LENGUAJELos científicos han desarrollado un nuevo modelo de IA que puede razonar de manera diferente a la mayoría de los modelos de lenguaje principales como ChatGPT , lo que le permite funcionar significativamente mejor en métricas clave.
Esta nueva IA, denominada modelo de razonamiento jerárquico (HRM), está inspirada en un procesamiento de múltiples capas y múltiples escalas de tiempo en el que diferentes regiones del cerebro integran información durante períodos de tiempo que van desde milisegundos a minutos.
Investigadores de la empresa de inteligencia artificial Sapient, con sede en Singapur, afirman que este modelo ofrece mayor eficiencia y rendimiento porque requiere muchos menos parámetros y ejemplos de entrenamiento. Mientras que HRM trabaja con tan solo 27 millones de parámetros y 1000 ejemplos de entrenamiento, los LLM avanzados requieren miles de millones o incluso billones de parámetros. Aunque aún no se ha verificado, algunas estimaciones sugieren que el recién publicado GPT-5 contiene entre 3 y 5 billones de parámetros.
Los superó a todos en la prueba.Los investigadores probaron HRM en la rigurosa prueba ARC-AGI, que mide su afinidad con la inteligencia artificial general (IAG). El estudio reveló que el sistema obtuvo resultados notables.
En la prueba ARC-AGI-1, HRM obtuvo un puntaje de 40,3%, mientras que el modelo o3-mini-high de OpenAI obtuvo un puntaje de 34,5%, el modelo Claude 3.7 de Anthropic obtuvo un puntaje de 21,2% y Deepseek R1 obtuvo un puntaje de 15,8%.
En la prueba más desafiante ARC-AGI-2, HRM obtuvo un 5%, mientras que o3-mini-high obtuvo un 3%, Deepseek R1 un 1,3% y Claude 3,7 un 0,9%.
Muchos programas de maestría en derecho avanzados utilizan la Cadena de Pensamiento (CdP), un método que intenta resolver problemas complejos descomponiéndolos en pasos más simples. Este método imita el proceso de pensamiento humano, descomponiendo problemas complejos en partes digeribles.
Sin embargo, los investigadores de Sapient argumentan que el método CoT presenta debilidades como la frágil separación de tareas, la necesidad de grandes conjuntos de datos y una alta latencia. HRM, por otro lado, aplica un razonamiento único en dos módulos sin requerir instrucciones explícitas sobre los pasos intermedios:
- El módulo de nivel superior es responsable de la planificación lenta y abstracta,
- El módulo de nivel inferior realiza cálculos rápidos y detallados.
Este método se asemeja a la forma en que las diferentes áreas del cerebro procesan la información. Además, HRM utiliza el refinamiento iterativo para refinar una solución a lo largo de varios intervalos cortos de pensamiento. Con cada intervalo, se decide si el proceso continúa o si se presenta como la respuesta "final".
Logró el éxito en Sudokus y Laberintos.HRM logró resultados casi perfectos en complejos rompecabezas de Sudoku que los LLM tradicionales no podían manejar, y también se destacó en tareas como encontrar el camino más corto a través de laberintos.
Tras el estudio, que aún no ha sido revisado por pares, el equipo que desarrolló el benchmark ARC-AGI volvió a evaluar los resultados por sí mismo después de que el modelo de gestión de recursos humanos se publicara en GitHub. Si bien confirmaron las cifras, también observaron algunos hallazgos sorprendentes. Por ejemplo, destacaron que la arquitectura jerárquica apenas mejoraba el rendimiento, y que la verdadera mejora provenía de un mecanismo de ajuste no documentado en el proceso de entrenamiento.
mynet