Saltar al contenido
Tecnología

Ni las mentes mas brillantes lo esperaban: una IA de OpenAI resolvió un problema que desafió a expertos durante 80 años

El matemático Will Sawin habla de su experiencia al revisar y refinar una prueba matemática lograda por el modelo interno de OpenAI, y lo que podría significar para las matemáticas.
Por Gayoung Lee Traducido por

Tiempo de lectura 7 minutos

Comentarios (0)

Will Sawin recibió el e-mail de OpenAI el viernes por la noche. O el sábado muy temprano. Más allá de eso, este matemático profesional pasó todo el fin de semana pensando en ese e-mail. El lunes decidió escribir un trabajo que mejoraba lo que le habían enviado, la “prueba” de IA del problema matemático de Paul Erdős.

La semana pasada OpenAI publicó un posteo de blog sobre la solución que dio la IA, y citó comentarios de nueve matemáticos de renombre que no tienen relación con OpenAI, como el propio Sawin. Muchos de los matemáticos elogiaron el trabajo, y el ganador de la Medalla Fields Tim Gowers dijo que es “un hito en las matemáticas de IA”. Se trata de una de las muchas soluciones de la IA a enigmas matemáticos históricos, con lo que hay que preguntarse si la IA estaría dando inicio a una era de avances matemáticos.

¿Estamos ante la imitación de la inteligencia humana impulsada por la IA, como lo indica el papa León en su última encíclica?

La velocidad evolutiva de la IA sorprende a todos

A lo largo de la historia han surgido conjeturas matemáticas imposibles, y en cada ocasión, los matemáticos humanos deben verificar el trabajo de la computadora. Gizmodo se puso en contacto con Will Sawin, que interpretó los resultados y buscó responder esa pregunta.

Sawin es profesor de matemáticas de la Universidad Princeton, e inició su carrera académica a los 10 años. Desde entonces, se ha dedicado a la teoría de los números, la geometría algebraica y la combinatoria. Le preguntamos sobre su experiencia al revisar las soluciones matemáticas derivadas de la IA, sobre la realidad del uso de la IA en las matemáticas y lo que todavía no ha logrado resolver.

Gayoung Lee, Gizmodo: El título del posteo es “un modelo de OpenAI resuelve una conjetura central en la geometría discreta”. ¿De qué se trata?

Will Sawin: Empezamos por algo simple: encontrar la mejor disposición de puntos en un plano para maximizar el número de pares a una distancia fija. Puedes intentarlo con construcciones diferentes, y si lo haces a mano encontrarás que una grilla de puntos dispuestos en forma triangular logrará que cada punto estará a la misma distancia respecto de otros 6  puntos. Funciona si los puntos son pocos. Pero la pregunta es “’¿Cuántos pares de puntos se pueden ubicar a exactamente una unidad de distancia entre sí en un plano?”. Erdős propuso que la cantidad máxima de pares no podía crecer mucho más rápido que el número de puntos, y apostó por un crecimiento prácticamente lineal a medida que se añadían puntos. 

Cuando Erdős presentó el problema hace 80 años, no tenía certezas de que fuera así, pero con el tiempo tal vez sí ya que nadie lograba hacer que ese crecimiento fuera más veloz.

Gizmodo: ¿Qué significa probar o refutar una conjetura en matemáticas? ¿Qué significa que se haya “resuelto” un problema?

Sawin: En matemáticas, probar o refutar significa un argumento que convence por completo y no deja lugar a dudas. Lo que los matemáticos consideran prueba ha ido cambiando con el tiempo. Hace siglos, se usaba un razonamiento físico y se consideraba que refería al mundo real para considerar que algo era prueba matemática.

Pero hoy los estándares son diferentes. Uno de ellos refiere a la prueba formal. Hay sistemas formales de pruebas con reglas lógicas, y comúnmente se cree que la prueba debería ser formal. Si la prueba es informal, solo sirve como prueba válida si hay una explicación de por qué existe la prueba formal. Pero eso ya es más filosófico. La prueba de OpenAI en cuestión es una prueba informal que eventualmente podrías convertir en prueba formal si lo deseas. A eso se refieren los matemáticos cuando dicen que “se probó” algo.

Gizmodo: Entonces ¿la prueba de OpenAI es informal?

Sawin: Se parece en mucho a las pruebas informales que producen los matemáticos, y hay algo en su organización que para el que no ha visto muchas pruebas matemáticas evidencia que no es tal cual lo escribiría un matemático, pero para el que no tiene experiencia, lo convencería.

Gizmodo: ¿Cuál sería el contenido de la prueba informal,  cómo llegó la IA a sus conclusiones?

Sawin: Si intentas probar lo que dijo Erdős tendrías que razonar sobre toda colección posible de puntos en el plano para llegar a un argumento válido para todo conjunto de puntos. Por lo tanto, en cierto sentido es más fácil refutar porque solo tienes que presentar una secuencia específica de puntos en el plano. Se trata del límite a medida que el tamaño crece al infinito y tienes que construir una secuencia y demostrar que tiene muchas iteraciones de la misma unidad de distancia.

La IA lo logró usando la teorías de números algebraicos para usar un anillo de los números enteros en un campo de números algebraicos. No suena demasiado diferente respecto de lo que ya habían intentado los matemáticos, pero la clave está en que la IA entendió que no sólo puedes usar campos de números algebraicos sino que además puedes usarlos en grados crecientes. Eso aumenta la complejidad de los números con los que estás trabajando,  y así, la cantidad de unidades de distancia aumenta más rápidamente de lo que esperaba Erdős.

En los últimos meses muchos intentaron usar la IA para generar soluciones a los miles de problemas propuestos por Erdős. Algunas de las soluciones no son muy impresionantes, y otras consisten en que la IA descubra que alguien escribió un trabajo para resolver un problema que no sabían que existía.

Sin embargo, en algunos casos la IA introduce ideas nuevas que los humanos no han utilizado. A veces no son ideas muy interesantes, pero otras veces hacen que los humanos se pregunten qué podrían hacer con esa idea, algo parecido a lo que sucedió aquí con OpenAI. Creo que se trató de una idea más técnicamente intrincada que las que yo había visto hasta ahora.

Puedo mencionar razones para ser escépticos. Pero esta es una idea que, hasta donde se sabe, ningún humano propuso y no es que no se pudiera sino que era difícil que alguien la propusiera. Es algo que suele suceder. No es una situación en la que la IA  haya hecho algo que los humanos no pueden hacer.

Gizmodo: Y su trabajo “refinó” la prueba de la IA…

Sawin: La prueba de OpenAI afirma que la función aumenta a mayor velocidad, y yo quería tratar de llegar a un valor explícito para n > 1. Un valor razonablemente bueno que no se alejara mucho de 1, y llegué a la conclusión de que es poco más de 1.01. Otros lo mejoraron y ahora se considera que es 1.03.

Mientras leía el argumento de la IA e intentaba entender cada paso, pensaba cómo hacer cada paso de manera eficiente. Muchas de las cosas del argumento de la IA eran ineficientes, y eso no sorprende, ya que un humano no lo escribiría de esa forma. Pero la IA no buscaba ser eficiente. El argumento original no tenía nada de incorrecto. Mi objetivo era un tanto diferente.

Gizmodo: ¿Y OpenAI no se molestó?

Sawin: Les dije lo que había hecho, y les pareció bien. En su anuncio mencionan mi trabajo.

Gizmodo: ¿Esto influyó en cómo ven el impacto de la IA en su trabajo, o la percepción de su trabajo en las matemáticas?

Sawin: Las IAs son muy efectivas haciendo dos cosas: una es la búsqueda de literatura, ya que si le preguntas a un gran modelo de lenguaje es más probable que obtengas el resultado a la pregunta de si existe tal o cual teorema; y la otra es que la IA es buena para leer y editar un trabajo, y no solo me refiero a errores de tipeo o gramática, sino a errores matemáticos que afectarían el resultado.

Yo reviso mis trabajos con revisión humana porque es lo que corresponde, y creo que la mayoría de los matemáticos no permitirían que la IA escriba sus trabajos, no solo por responsabilidad y credibilidad sino porque no hay que confiar plenamente en la IA. Ha mejorado mucho, pero sigue teniendo puntos ciegos. Si usas una idea generada por la IA, tienes que expresar lo que entiendes como humano de todos modos.

En cuanto a generar ideas, no encuentro que la IA sea muy efectiva, y creo que es en parte porque varía de un campo de las matemáticas a otro. Le resulta más fácil cuando hay un contexto más técnico y menos trabajos anteriores para usar como punto de comparación.

Gizmodo: Que la IA tenga una idea no necesariamente significa que sea una idea que jamás se le habría ocurrido a un humano.

Sawin: Así es. Si le pido una idea a la IA no lo haría para descartar las que ya se me ocurrieron como respuesta a una pregunta.

Gizmodo: Para un matemático, ¿la IA es una herramienta de búsqueda, o su socia?

Sawin: Hoy, diría que es una herramienta. Quienes tienen más éxito son los que usan la IA como herramienta. Claro que puede suceder que aparezca alguien que le indica a la IA que revise la literatura reciente, que presente problemas, y los resuelva, y que tal vez, surja algo interesante. Pero por lo que sé, eso todavía no ha sucedido. No quiero hacer predicciones sobre el futuro. Solo digo cuál es la realidad en estos días.

Gizmodo: Un consejo, por favor. Cuando vemos alguna fantástica solución escrita por la IA ¿qué es lo más importante que tenemos que preguntar?

Sawin: Bueno, si alguien dice “Oh, la IA resolvió este imposible problema matemático”, no creo que sea así. No es que la IA resuelva un imposible problema matemático. Pero tampoco es que no sirva para nada. Creo que está en la zona gris, en medio de las dos cosas.

He visto personas que al principio suponen que si la IA resolviera un problema matemático imposible, se acaban las matemáticas humanas. Pero también he visto gente que reacciona suponiendo que la IA no hace absolutamente nada. Definitivamente, creo que la realidad está en medio de los dos extremos.

Compartir esta historia

Artículos relacionados