Un model d'IA de la xinesa DeepSeek arrasa en l'Olimpíada Matemàtica Internacional el 2025

Intel·ligència artificial 

La companyia utilitza un sistema que li permet resoldre 5 dels 6 problemes plantejats i obtenir un nivell equivalent a medalla d'or

Horizontal

El logotip de DeepSeek en una pantalla davant un teclado 

Dado Ruvic / Reuters

La companyia xinesa DeepSeek, que a començaments d'aquest any va posar en un compromís a la seva competència d'intel·ligència artificial pel seu assequible mètode per entrenar el seu model de llenguatge, ha llançat DeepSeek-Math-V2, un model raonador de codi obert que ha assolit prestacions de medalla d'or en les Olimpíades Matemàtiques Internacionals (IMO per les seves sigles en anglès) del 2025. El fet que aquesta IA es posi al nivell d'altres d'avantguarda en raonament matemàtic i que sigui de codi obert no només qüestiona el preu d'altres models, sinó que a més democratitza l'accés a aquesta tecnologia.

A més de resoldre 5 dels 6 problemes de l'IMO 2025, amb la qual cosa va assolir un nivell de medalla d'or, assolint l'estàndard d'or, DeepSeek-Math-V2 ha obtingut una puntuació de 118 sobre 120 punts possibles en la competició Putnam 2024 amb el que supera la més alta assolida per un ésser humà. La companyia xinesa destaca que el seu model “demostra una gran capacitat per demostrar teoremes”, que requereix un tipus de raonament complex.

El model matemàtic de DeepSeek utilitza un tipus d'arquitectura de xarxa neuronal que divideix una tasca complexa en problemes més senzills i manejables per assignar-los a unes xarxes neuronals especialitzades. DeepSeek-Math-V2 fa servir un sistema en el qual un model proposa una prova i un altre la critica, en lloc de recompensar només les respostes finals. El que verifica assigna puntuacions de confiança a cada un dels passos.

Així. El model generador refina la lògica feble i garanteix una autodepuració del raonament a cada pas. A l'abordar d'aquesta forma els raonaments matemàtics, es poden reduir al·lucinacions al validar passos intermedis. Segons DeepSeek, “tot i que encara queda molta feina per fer, aquests resultats suggereixen que el raonament matemàtic autoverificable és una direcció d'investigació viable que pot ajudar a desenvolupar sistemes d'IA matemàtica més capaços”.

DeepSeek va saltar a la fama després de llançar un model de codi obert i baix cost que rivalitzava amb els sistemes d'IA dels Estats Units. El llançament del seu raonament DeepSeek-R1 va suscitar dubtes sobre si els models oberts podrien erosionar l'avantatge comercial dels productes tancats, la qual cosa va sacsejar breument la confiança dels inversors en gegants de la IA com NVIDIA.

Lee también

A finals de gener passat, DeepSeek es va fer famosa al llançar el seu nou model R1 i explicar que el van entrenar a baix cost i sense necessitat de recórrer als potentíssims i cars xips de Nvidia, que durant uns dies va registrar una de les pitjors caigudes borsàries de la història, de la que ja s'ha recuperat. Aquesta companyia xinesa va demostrar que és possible un enfocament de codi obert a què pot accedir tothom sense grans costos.

Fa quinze dies, Google DeepMind va presentar el seu model AlphaProof, que va resoldre tres dels cinc problemes no geomètrics de l'IMO 2024 per a estudiants de secundària. El mètode fet servir per aquesta IA genera variants del problema per adaptar l'aprenentatge a cada cas concret.

Mostrar comentarios
Cargando siguiente contenido...