OpenAI lanza un nuevo modelo en ChatGPT para competir con Gemini 3 de Google

Inteligencia artificial

GPT-5.2 comete entre un 30% y un 38% menos de errores de invención que la versión precedente 5.1

El nuevo modelo GPT-5.2 de OpenAI.

El nuevo modelo GPT-5.2 de OpenAI.

OPENAI / Europa Press

Respuesta a la alerta roja lanzada a principios de este mes por Sam Altman, el director ejecutivo de OpenAI, para responder al lanzamiento de Gemini 3 de Google, que le ha supuesto una seria llamada de atención. La compañía de ChatGPT acaba de lanzar el nuevo modelo GPT-5.2 en sustitución del 5.1, aunque el cambio no es sólo cosmético, porque supone un salto en fiabilidad y rendimiento, especialmente en tareas complejas. Uno de los avances más significativos es que el nuevo modelo comete entre un 30% y un 38% menos errores de invención, las llamadas alucinaciones, que su antecesor.

Aunque se presenta como un solo modelo, GPT-5.2. Llega en realidad en tres versiones, disponible ya para las versiones de pago, denominadas Instant, Thinking y Pro. Instant se encarga de las tareas más rápidas de llevar a cabo, como escribir o traducir. Thinking se dedica al llamado “razonamiento simulado” para trabajos más complejos, como las matemáticas o la generación de código de programación. La versión Pro abunda más en el razonamiento para ofrecer el máximo rendimiento en problemas complejos..

El lanzamiento de GPT-5.2 se produce después de comprobar como Gemini 3 de Google se había situado como el gran referente del mercado. Mientras que OpenAI tiene 800 millones de usuarios, Google alcanza ya con Gemini 650 millones de usuarios registrados y tiene una base muy amplia sobre la que crecer a partir de su buscador de internet, prácticamente el portal universal de acceso a la red para la mayoría de la población. A principios de mes, Altman emitió una directiva interna bajo un “código rojo”, según publicó la web The Information, después de que Gemini 3 superara a GPT-5.1 en la mayoría de pruebas. La orden del líder de OpenAI fue dejar de lado cualquier otra iniciativa que no fuera mejorar los resultados de su IA.

El resultado es GPT-5.2. En su versión Thinking, según OpenAI, supera o empata con los profesionales humanos en el 70,9 % de las tareas de una de las pruebas de laboratorio llamada GDPval en la que Gemini 3 Pro se quedó en un 53,5%. La compañía asegura que su nuevo modelo completa esa serie de tareas 11 veces más rápido que los expertos humanos y con un coste de sólo el 1% de lo que costarían estos.

“Hemos diseñado la versión 5.2 para ofrecer aún más valor económico a las personas”, ha afirmado Fidji Simo, director de producto de OpenAI, en una rueda de prensa. “Es mejor creando hojas de cálculo, elaborando presentaciones, escribiendo código, percibiendo imágenes, comprendiendo contextos largos, utilizando herramientas y vinculando proyectos complejos de varios pasos”, ha concluido. Según el comunicado oficial de la empresa, “GPT‑5.2 Thinking es el mejor modelo hasta ahora para uso profesional en entornos reales”.

Lee también

En las pruebas ARC-AG-1I, diseñadas para evaluar el grado de aproximación a una llamada inteligencia artificial general, GPT‑5.2 es el primer modelo en pasar del 90%. En la versión del test ARC-AGI-2 (Verified), que incrementa la dificultad, la versión Thinking llega al 52,9% y la Pro al 54,2%, “ampliando todavía más -apunta OpenAI- la capacidad del modelo para analizar problemas novedosos y abstractos”.

Etiquetas
Mostrar comentarios
Cargando siguiente contenido...