Anuncio cerrado

Samsung intenta demostrar que un modelo de IA capaz no tiene por qué ser grande ni costar millones de dólares en entrenamiento. Un modelo pequeño también puede competir, e incluso superar, a modelos de IA miles de veces más grandes.

Alexia Jolicoeur-Martineau, investigadora principal en inteligencia artificial en el Samsung Advanced Institute of Technology (SAIT) en Montreal, Canadá, publicó recientemente un nuevo artículo titulado Less is More. (mHay más), en el que anunció Estañoy Modelo de recursión (TRM). Artículo con título completo Menos es más: razonamiento recursivo con redes diminutas Reveló que TRM utiliza un modelo de inteligencia artificial con siete millones de parámetros y dos capas. Se entrenó con casi mil ejemplos y aún supera a los principales modelos de la competencia, como o3-mini de OpenAI y Gemini 2.5 Pro.

TRM obtuvo un rendimiento excepcional en la prueba de referencia ARC-AGI en problemas estructurados y visuales basados ​​en cuadrículas, como sudokus, laberintos y rompecabezas. Esta prueba de referencia de IA para la investigación se considera generalmente muy difícil para los modelos de inteligencia artificial.

En concreto, TRM ha conseguido los siguientes resultados en el benchmark ARC-AGI:

  • Más del 87% de precisión en Sudoku-Extreme
  • 85% de precisión en rompecabezas de dificultad difícil
  • 45% de precisión en ARC-AGI-1
  • 8% de precisión en ARC-AGI-2

"La idea de que uno debe confiar en grandes modelos entrenados por millones de dólares por alguna gran corporación para resolver tareas complejas es errónea”. Jolicoeur-Martineau dijo en la red social X. “Actualmente, se presta demasiada atención al uso de LLM (lenguaje grande modelos) que diseñar y expandir nuevas direcciones", ella añadió.

Este modelo de IA pretende demostrar que es posible desarrollar una IA capaz, incluso si carece de la inversión masiva en GPU y potencia de procesamiento necesarias para entrenar los modelos paramétricos más grandes y multimillonarios que la impulsan. chatZapatos con LLM.

Lo más leído de hoy

.