Tecnología

Los chatbots de Google y OpenAI quieren sus medallas de oro en las Olimpíadas Internacionales de Matemáticas

Puede ser, pero ¿cómo les iría en los 100 metros llanos?

Por AJ Dellinger Traducido por Lucas Handley Publicado el 23 de julio de 2025, 09:35 ET

Tiempo de lectura 3 minutos

Diseño Sin Título 2025 07 23t100036.245 — © Win McNamee

Los modelos de inteligencia artificial desarrollados por DeepMind de Google y OpenAI pueden sumar un logro más a su lista de éxitos: les ganaron en matemáticas a unos estudiantes de la escuela secundaria. Ambas compañías afirman haber ganado una medalla de oro en las Olimpíadas Internacionales de Matemáticas (IMO, en inglés), una de las competencias más duras para estudiantes de la secundaria que buscan demostrar su capacidad matemática.

Las Olimpíadas invitan a estudiantes de todo el mundo a participar de un examen que requiere que resuelvan una cantidad de problemas matemáticos complejos y de múltiples pasos. Los estudiantes pasan dos días resolviendo los exámenes, que se agrupan de a dos, de cuatro horas y media cada uno. Deben resolver en total seis preguntas, con puntaje que se asigna según vayan completando diferentes partes de los problemas. Los modelos de DeepMind y OpenAI resolvieron perfectamente cinco de las seis preguntas, obteniendo un puntaje de 35 sobre 42 puntos posibles, suficiente como para la medalla de oro. Participaron 630 humanos, de los que 67 lograron llevarse a casa la medalla de oro.

Hay un detalle que en realidad no tiene que ver con los resultados, sino más con el comportamiento de las compañías. Se había invitado a DeepMind a participar de las IMO, y anunció en un posteo del blog el lunes que había ganado la medalla de oro, después de que la organización publicara los resultados oficiales de los participantes humanos. Según Implicator.ai, OpenAI no se inscribió para las IMO sino que tomó los problemas – que se publican para que otros puedan tratar de resolverlos – y los resolvieron por su cuenta. OpenAI anunció que su desempeño era del nivel de la medalla de oro, pero eso no se puede verificar porque no participó de las olimpíadas. Además, la compañía anunció su puntaje el fin de semana en lugar de esperar hasta el lunes (cuando se anuncian los puntajes oficiales), en contra de los deseos de las IMO que habían solicitado a las compañías que no les robaran el protagonismo a los estudiantes.

Iguales condiciones

Los modelos utilizados para resolver los problemas participaron del examen en iguales condiciones que las de los estudiantes, con 4,5 horas para cada examen y sin poder utilizar herramientas externas o acceder a Internet. Lo notable es que parece que las dos compañías utilizaron la IA de propósitos generales en lugar de modelos especializados, que antes habían funcionado mucho mejor que los modelos para todo uso.

Uno de los datos a señalar sobre lo que afirman las compañías en cuanto a su medalla de oro: ninguno de los modelos que lograron el oro está disponible para el público. De hecho, los modelos públicos no resolvieron los problemas matemáticos, aunque los investigadores los pasaronpor Gemini 2.5 Pro, Gro-4 y OpenAI 04, pero ninguno de estos modelos logró un puntaje mayor a 13 puntos, menos de los 19 requeridos para la medalla de bronce.

Todavía hay mucho escepticismo en cuanto a los resultados, y el hecho de que los modelos disponibles al público fracasaran, sugiere que hay una brecha entre las herramientas a las que podemos acceder y lo que puede hacer un modelo más avanzado, lo que debería hacer que nos preguntemos por qué esos modelos más inteligentes no pueden hacerse a escala, o ponerse a disposición de todos. Pero hay dos cosas que podemos aprender de esto: los modelos de laboratorio están mejorando en el razonamiento para resolver problemas, y OpenAI está liderada por un grupo de tontos impacientes por robarles la gloria a unos adolescentes.

Compartir esta historia

Artículos relacionados

Ahora Anthropic suma más religiones a su proyecto de lograr que la moral de Claude sea perfecta

Anthropic (y OpenAI) se reunieron con representantes de diversas religiones. ¿Servirá de algo?

Tecnología Mike Pearl Traducido por Romina Fabbretti 10 May

Un proyecto de conservación de rinocerontes utiliza radioactividad en sus cuernos

Con ingenio se busca evitar el comercio ilegal

Tecnología Romina Fabbretti 10 May

Japón ha enviado una “caja de madera” al espacio para resolver un problema que va a peor. La apuesta por materiales biodegradables contra la basura orbital

Un pequeño satélite experimental fabricado con madera pone a prueba si los materiales orgánicos pueden soportar el vacío, las radiaciones y los cambios extremos de temperatura. El objetivo no es la estética, sino reducir el impacto ambiental de miles de artefactos que acabarán reentrando en la atmósfera en las próximas décadas.

Tecnología Romina Fabbretti 10 May

Estados Unidos acelera hacia Mach 20 con un vehículo hipersónico experimental. Por qué estas pruebas marcan un salto clave en la nueva carrera armamentística

Estados Unidos ya prueba vehículos capaces de volar a más de Mach 20 y superar los 24.000 km/h en la atmósfera. Este salto hipersónico no es un experimento aislado y redefine la nueva carrera armamentística

El programa liderado por el Pentágono y Rocket Lab apunta a algo más profundo que un récord de velocidad. Se trata de dominar un terreno donde el tiempo de reacción se reduce al mínimo y donde la superioridad tecnológica puede decidir conflictos antes incluso de que comiencen.

Tecnología Martín Nicolás Parolari 10 May

La física ya sabe cómo “burlar” la velocidad de la luz. La mala noticia es que la tecnología podría tardar siglos en alcanzarla

La relatividad ya permite imaginar viajes más rápidos que la luz sin romper las leyes del universo. Lo que no tenemos es la tecnología (ni la energía) para hacerlos realidad

Nuevos trabajos teóricos refinan el concepto del motor de curvatura para que no destruya a la tripulación. Aun así, los requisitos energéticos y la ausencia de “materia exótica” mantienen estos viajes en un horizonte que podría quedar a cientos o miles de años.

Tecnología Martín Nicolás Parolari 9 May

Sam Altman dice que entrenar una IA no es tan ineficiente como parece. Lo ineficiente, según él, es “entrenar” a un humano durante 20 años

Entrenar una IA consume mucho, pero Sam Altman cree que el problema está mal planteado. Esta pregunta incómoda todavía sigue sin respuesta

En un evento de The Indian Express, el CEO de OpenAI comparó el coste energético de entrenar modelos de IA con el “entrenamiento” de una persona a lo largo de décadas. La analogía es provocadora, pero deja intacta la gran pregunta: ¿cuánta energía consume realmente usar ChatGPT en el día a día?

Tecnología Romina Fabbretti 9 May

Los chatbots de Google y OpenAI quieren sus medallas de oro en las Olimpíadas Internacionales de Matemáticas

Iguales condiciones

Lo último

Un cargamento de hierro perdido hace 2.000 años aparece en un río de los Balcanes. El hallazgo que obliga a redibujar el mapa económico de la Europa prerromana

El juego de coches que quiere dejar de parecer móvil: Racing Master ya está aquí

Urano ya no es solo una esfera azul lejana. El James Webb ha logrado “ver” su atmósfera en 3D y ha cambiado la forma de estudiar los gigantes helados

Cultivar en calma, servir bajo presión: el cozy que rompe su propia tranquilidad

La realidad es aterradora: Ya ni el empleo nos protege de la pobreza. Qué está fallando en la promesa del trabajo en las economías occidentales y cómo se está rompiendo el viejo contrato social

El indie que nadie esperaba ya está ganando premios antes de salir (y podría explotar en 2026)

La Tierra se congeló casi por completo y los océanos alcanzaron temperaturas imposibles. Lo que revelan ahora las rocas sobre el planeta más frío de su historia

El terror cambia de forma: The Sinking City 2 abandona el misterio puro y se vuelve mucho más brutal

Artículos relacionados