Sociedad Neo

Buscar información en Google y ChatGPT no sería posible sin Karen Spärck Jones, la madre de los buscadores modernos

Google

“La informática es demasiado importante como para dejarla solo en manos de los hombres”

'Parasocial' es la palabra del año según Cambridge, ¿qué significa y qué dice de nosotros como sociedad?

Karen Spärck Jones, informática británica.

Karen Spärck Jones, informática británica.

X

Mucho antes de que Google se hiciera de oro gracias a la sencillez con la que permite buscar información, y de que ChatGPT convirtiera la búsqueda online en una conversación directa, una matemática británica sentó las bases de cómo los ordenadores deciden qué es relevante y qué no.

Karen Spärck Jones desarrolló, durante las décadas de 1960 y 1970, el concepto de TF-IDF (term frequency–inverse document frequency), una fórmula matemática que analiza la importancia de cada palabra dentro de un documento. 

Esta idea, que puede parecer abstracta, en realidad, se basaba en algo bastante sencillo: definir qué da significado a un texto y qué simplemente es complemento. Hasta entonces, las máquinas se centraban en discernir las palabras más repetidas, pero Spärck Jones dejó claro que éstas no tienen por qué ser las más importantes. Normalmente, son adjetivos o formulaciones vacías. Y, de hecho, las menos frecuentes pueden ser las que realmente definen el contenido.

Este principio, que es la base clara de la IA y de los buscadores, fue ya una gran revolución en su momento. Hasta entonces, los sistemas funcionaban de forma casi literal, limitándose a localizar coincidencias exactas. Pero gracias al trabajo de Spärck Jones, los ordenadores comenzaron a ordenar la información por importancia, algo que ha sido clave en el desarrollo de la tecnología. 

Karen Spärck Jones, informática británica.
Karen Spärck Jones, informática británica.LinkedIn

La carrera de Spärck Jones se desarrolló principalmente en la Universidad de Cambridge, donde la informática aplicada al lenguaje se consideraba un campo secundario y el reconocimiento institucional era escaso. Y a ello se sumó una discriminación de género que la propia Spärck Jones denunció con claridad. En una de sus frases más citadas, lo dejó claro: “La informática es demasiado importante como para dejarla solo en manos de los hombres”.

Infravalorada durante años, con el tiempo se ha convertido en uno de los pilares de la informática actual. Hoy, el TF-IDF se aplica en buscadores web, filtrado de spam, análisis documental y mucho más. Y, aunque fuera ninguneada en su momento, el tiempo la ha puesto en el pedestal que merece.

Creativo y tecnólogo. Escribo sobre IA y cultura digital. Fundé una productora y una Proptech. Hablemos de futuro.

Etiquetas