Regalar la intel·ligència té un cost

Barcelona

02/02/2025 07:49

Setmana de malson per a les companyies que desenvolupen intel·ligència artificial dels Estats Units. Al daltabaix borsari patit dilluns per gran part d’aquestes companyies, amb Nvidia liderant les pèrdues d’una manera mai vista, cal afegir la sensació de desconcert en què les ha sumit l’aparició de DeepSeek. La idea que els turmenta és que ara el món creu (sap) que es pot fer IA d’una manera competitiva i més barata, cosa que pot trastocar no només expectatives, sinó també grans inversions. Algunes claus del que ha passat són en la gratuïtat que han tingut productes d’IA desenvolupats per enginyers d’aquestes mateixes companyies.

Un dels elements principals és l’arquitectura d’aprenentatge profund Transformer, desenvolupada per investigadors de Google i publicada en codi obert, a disposició de tothom, el 2017. Vuit investigadors de Google van presentar aquell any el document Tot el que necessites és atenció , amb què van presentar Transformer, una nova arquitectura d’aprenentatge profund en què es basen els grans models de llenguatge d’intel·ligència artificial.

L’arquitectura Transformer de Google i el model Llama de Meta, bases de la IA de la Xina

El novembre del 2022, OpenAI va presentar ChatGPT, alimentat pel seu model de llenguatge GPT-3.5, basat en el descobriment dels enginyers de Google.

La ràpida aliança entre OpenAI i Microsoft va posar el treball desenvolupat per Google en contra seva, ja que li va obrir competència (però encara limitada) fins i tot en el camp de les cerques, que representa l’essència de la companyia.

A l’altre costat de la balança, la gratuïtat amb què es va oferir el treball d’investigació que va culminar en l’arquitectura Transformer va propiciar el boom de la IA generativa, amb centenars d’enginyers arreu del món treballant des d’aquelles bases, i va democratitzar l’accés a una tecnologia capdavantera.

Aquesta vocació altruista, paradoxal en empreses que prioritzen el màxim benefici en moltes de les seves decisions, ha alimentat també DeepSeek a partir del model Llama de Meta, la companyia de Mark Zuckerberg, que també es va publicar amb llicència oberta. D’aquesta manera, tota la comunitat de desenvolupadors va poder treballar amb aquesta intel·ligència artificial. L’empresa xinesa va fer servir Llama com a base per poder crear la seva. La IA xinesa és possible gràcies a la generositat de Meta, una de les poques companyies que dilluns no es va afegir a les caigudes generalitzades que van afectar moltes tecnològiques i que fins i tot va guanyar un 1,9%.

Malgrat aquesta dada, el decorat de fons que ha deixat la irrupció de DeepSeek per a les companyies dels Estats Units hegemòniques en la intel·ligència artificial és la possibilitat que la competició per aquesta tecnologia sembla estar molt oberta. L’existència del model DeepSeek ha qüestionat que hi hagi una relació directa entre el volum de la inversió i la capacitat i eficàcia dels models. Això pot donar lloc que apareguin altres empreses que facin servir la mateixa estratègia.

A les explicacions que donen les empreses dels Estats Units sobre com ha arribat DeepSeek a crear un model de llenguatge capdavanter, OpenAI ha expressat sospites que la companyia xinesa pot haver fet servir una tècnica anomenada destil·lació per aprofitar-se’n.

Aquest mètode consisteix en el procés en què un nou model aprèn d’un altre fent-li centenars de milers de preguntes i analitzant les respostes per aprendre’n, com un alumne amb un mestre. Quan acaba el procés d’aprenentatge, els resultats del mestre i l’ alumne són molt semblants.

No hi ha proves, de moment, que DeepSeek fes servir aquest mètode amb els models d’OpenAI per aprendre’n, una mena d’actuació que està prohibida en les condicions d’ús de ChatGPT.

En qualsevol cas, OpenAI ha revelat al món com una empresa petita pot aprofitar-se del seu treball per competir-hi. Un gran model de llenguatge, creat amb una enorme inversió i milers d’hores de treball, pot ser l’aliment d’un model petit i barat que acabi rivalitzant-hi. El plantejament sembla fora de tota lògica capitalista.

Francesc Bracero

Ver más artículos

Llicenciat en Periodisme per la UAB. Redactor de Guayana Guardian des del 1996. Ha cobert les àrees de Política, Esports i Comunicació. Especialitzat en tecnologia. Autor del llibre 'Bicicletas para la mente' (Península)

Regalar la intel·ligència té un cost

Aprenentatge

La xinesa DeepSeek s’aprofita del que companyies dels EUA ofereixen de franc

L’arquitectura Transformer de Google i el model Llama de Meta, bases de la IA de la Xina