Grok 3 no es tan lista, Elon

Si Grok 3, la nueva inteligencia artificial de X, fuera Groucho Marx, podría repetir una de las más celebradas frases del cómico en la película Sopa de ganso . En una escena en la que le enseñaron un informe, el cómico comentó: “¡Hasta un niño de cuatro años sería capaz de entender esto!”. Acto seguido añadió: “Rápido, busque a un niño de cuatro años. A mí me parece chino”.

Los hermanos Marx en una escena de 'Sopa de ganso'

Los hermanos Marx en una escena de 'Sopa de ganso' 

Hulton Archive / Getty Image

Aunque Elon Musk aseguró hace unos días que Grok 3 es “tan lista que da miedo”, no es lo mismo obtener puntuaciones altas en los rankings de pruebas a las que se someten los nuevos modelos que ponerse en manos de los usuarios para comenzar a demostrar si vale tanto como se publicita.

Los modelos de lenguaje parecen toparse con un muro a medida que se escalan con más datos

En la vida real, hay cosas que cualquier persona es capaz de resolver prácticamente sin pensar pero que hacen caer en errores notables a Grok 3 y a otros grandes modelos de lenguaje.

El psicólogo cognitivo Gary Marcus, uno de los expertos más críticos con los planteamientos de desarrollo de los grandes modelos de lenguaje, sometió a Grok 3 a algunas pruebas que demuestran que esta IA está todavía muy verde. Y lo hizo con cosas sencillas. Al pedirle, por ejemplo, que dibujara una bicicleta con caracteres ASCII, la IA de Musk apenas esbozaba cosas parecidas a la cara de un mono. No fue capaz tampoco de dibujar una imagen de una palabra y rodear correctamente con un círculo las vocales o las consonantes. Se lía con cosas tan fáciles como esta.

Grok 3 ha sido entrenado en el megacentro de datos Colossus que Elon Musk ha hecho construir en un tiempo récord –unos siete meses en dos fases– en Memphis (Tennessee) con la potencia bruta de 200.000 chips especializados de Nvidia. Miles de millones de dólares para obtener respuestas incorrectas parecen una mala combinación.

Uno de los grandes debates que planea hoy en el mundo de la inteligencia artificial es si escalar los modelos de lenguaje para hacerlos lo más grandes posible proporciona unos beneficios proporcionales. La irrupción hace unas semanas de la IA china DeepSeek demostró que se pueden obtener resultados equiparables a los que tienen los modelos de gran escala y computación masiva sin tener acceso a esos recursos materiales y financieros.

Para definir cómo los avances de los grandes modelos se reducen a medida que se aumenta su escalado con datos, los expertos hablan de muro. Es una manera simple de definirlo, pero ¿están chocando con una pared que cada vez se va a poner más imposible?

El consejero delegado de OpenAI y archienemigo de Musk, Sam Altman, opina que “no hay muro”. Pero otras compañías emplean en sus modelos enfoques híbridos entre una IA basada en datos y otra de carácter simbólico. El tiempo dirá si esa es la vía, pero por ahora Grok 3 no supera a un niño de cuatro años en algunas cosas.

Mostrar comentarios
Cargando siguiente contenido...