Samsung probeert te bewijzen dat een capabel AI-model niet groot hoeft te zijn en miljoenen dollars hoeft te kosten om te trainen. Een klein model kan ook concurreren met, en zelfs winnen van, AI-modellen die duizenden keren groter zijn.
Alexia Jolicoeur-Martineau, senior onderzoeker op het gebied van kunstmatige intelligentie aan het Samsung Advanced Institute of Technology (SAIT) in Montreal, Canada, publiceerde onlangs een nieuw artikel met de titel Less is More (mer is meer)waarin het aankondigde Tiny Recursiemodel (TRM). Artikel met volledige titel Minder is meer: recursief redeneren met kleine netwerken onthulde dat TRM een model voor kunstmatige intelligentie gebruikt met zeven miljoen parameters en twee lagen. Het werd getraind met bijna duizend voorbeelden en presteert nog steeds beter dan toonaangevende concurrerende modellen, zoals o3-mini van OpenAI en Gemini 2.5 Pro.
TRM presteerde uitzonderlijk goed in de ARC-AGI benchmark voor gestructureerde, visuele rastergebaseerde problemen zoals sudoku, doolhoven en puzzels. Deze AI-researchbenchmark wordt over het algemeen als zeer moeilijk beschouwd voor AI-modellen.
TRM behaalde met name de volgende resultaten in de ARC-AGI benchmark:
- Meer dan 87% nauwkeurigheid in Sudoku-Extreme
- 85% nauwkeurigheid bij Maze-Hard-puzzels
- 45% nauwkeurigheid in ARC-AGI-1
- 8% nauwkeurigheid in ARC-AGI-2
"Het idee dat je moet vertrouwen op grote modellen die voor miljoenen dollars zijn getraind door een groot bedrijf om complexe taken op te lossen, is verkeerd. Jolicoeur-Martineau zei op het sociale netwerk X. “Er wordt momenteel te veel aandacht besteed aan het gebruik van LLM (grote taal modellen) dan het ontwerpen en uitbreiden van nieuwe richtingen," voegde ze eraan toe.
Mogelijk bent u hierin geïnteresseerd
Met dit AI-model willen we aantonen dat de ontwikkeling van capabele AI mogelijk is, zelfs als daarvoor niet de enorme investering in GPU's en verwerkingskracht nodig is om de grotere parametrische modellen van miljarden dollars te trainen die de AI aandrijven. chatschoenen met LLM.
Interessant dat dit artikel alleen voor het tijdschrift Samsung is geschreven en dat je het nergens anders zult vinden 😁 Lang leve de objectiviteit!😅