
Si te gustan los puzzles numéricos es posible que esta semana hayas escuchado hablar de Sumplete, un pasatiempo estilo Sudoku supuestamente inventado por ChatGPT con la ayuda de un programador llamado Daniel Tait. La cuestión es que, a medida que Sumplete se iba haciendo conocido, han comenzado a aparecer dudas sobre su originalidad.
Muchos aficionados a los juegos de este tipo (entre ellos algunos lectores de Gizmodo) no han tardado en hacer notar que Sumplete es básicamente idéntico a dos juegos que llevan tiempo en las tiendas de aplicaciones móviles. El primero es Summer, un juego disponible desde 2020 en Google Play cuyas reglas son las mismas que las de la creación de ChatGPT. Básicamente se trata de eliminar cifras en una cuadrícula hasta lograr que cada fila y cada columna sumen unas cantidades establecidas.
Las App Summer y Rullo tampoco son las originales
Se da la circunstancia de que Summer probablemente a su vez se haya basado en Rullo, un juego idéntico que lleva en la App Store de los iPhone desde 2019. ¿Significa esto que Summer copió a Rullo y que ChatGPT ha copiado ambos y ha tenido el desparpajo de decirle a Daniel Tate que era un juego completamente nuevo? La respuesta es más complicada de lo que parece, porque tanto Summer como Rullo no son más que versiones para el móvil de un juego de lápiz y papel llamado Kakuro. De hecho, RP Apps and Games, el pequeño estudio de desarrollo detrás de Summer, reconoce de forma explícita en la misma página de Google Play que su app está basada en Kakuro.

¿Y Kakuro? Pues resulta que también es una copia. Como explican en The Art of Puzzles, Kakuro es el nombre por el que se conoce en Japón a un juego llamado originalmente Sumas Cruzadas (Cross Sums). Kakuro es precisamente una abreviación de la expresión Kasan Kurosu (literalmente sumas cruzadas en japonés). La invención de Cross Sums se atribuye a un canadiense llamado Jacob E. Funk hacia 1950. Por aquel entonces, Funk era empleado de Penny Press, la editorial que publica las revistas Dell, probablemente las publicaciones de pasatiempos más populares de Estados Unidos. En los años 60, los Cross Sums llegaron a Japón, donde se convirtieron en el pasatiempo número 1 del país hasta la llegada de los Sudoku en la década de los 90.
¿Es entonces Funk el auténtico creador del juego que ChatGPT bautizó como Sumplete? De nuevo, es muy probable que no. El trabajo de Jacob E. Funk era precisamente crear pasatiempos, y se cree que para llegar hasta Sumas Cruzadas se inspiro en los crucigramas tradicionales (cambiando letras por números) y en otros juegos numéricos que ya existían. Un estudio publicado en 2006 en la revista Pour la Science revela que los puzzles numéricos basados en cuadrículas ya aparecían en gacetas parisinas de finales del siglo XIX como Le Siècle. Aquellos pasatiempos de sumas y restas son el origen tanto de Sumas Cruzadas como de los Sudoku, y a su vez se inspiraban en los cuadrados mágicos, un pasatiempo matemático cuyos primeros ejemplos se remontan al siglo 190 antes de Cristo en China.

ChatGPT y la transparencia con los usuarios
En definitiva, que señalar que Sumplete se parece mucho a otros pasatiempos numéricos en forma de cuadrícula es una obviedad como señalar que la receta de pollo frito que pueda inventar ChatGPT se parece demasiado a todas las otras recetas de pollo frito que ya existían. Lo fascinante de toda esta historia en primer lugar es averiguar cómo ha llegado exactamente ChatGPT a crear algo como Sumplete. ¿Es una IA capaz de inferir de forma lógica una mecánica de juego así, o simplemente la ha copiado? A esa pregunta contesta Joel Lehman, científico experto en Aprendizaje Máquina y autor del libro “Why Greatness can’t not be planned” (Por qué la grandeza no se puede planificar). En un email remitido a Gizmodo, Lehman explica que “en principio, no hay nada que impida que ChatGPT presente un nuevo conjunto de reglas para un juego que no es estrictamente una simple variación de algo preexistente. Las razones sobre cómo es capaz de ello son un tema de debate mucho más largo. Lo que sí cabe esperar ahora mismo son algunas limitaciones, y puede ser difícil para ChatGPT inventar un juego completamente nuevo.”
La diferencia entre crear o copiar es importante porque entra de lleno en consideraciones de tipo ético. El propio Daniel Tait se queja de la seguridad con la que el chatbot le dijo que se trataba de un juego nuevo. “Mi principal preocupación es que ChatGPT me dijo con total confianza que se acababa de inventar un juego nuevo” explica el desarrollador en declaraciones realizadas a Digital Trends. ¿Copió ChatGPT las mecánicas de Summer y Rullo, o llegó a dar exactamente con la misma mecánica simplemente a partir de variaciones de puzzles anteriores como el cuadrado mágico? Es difícil saberlo, pero ahora mismo hay que darle a la IA el beneficio de la duda. Eso por no mencionar que fue capaz de escribir el código básico en HTML y Javascript para que el pasatiempo funcionara. Solo por eso es una valiosa herramienta para muchos programadores.
La segunda pregunta pertinente en el caso Sumplete es relativa a la transparencia. “Creo que habría que entrenar al modelo [de lenguaje] en que conteste con menos rotundidad a este tipo de preguntas, o a que no conteste en absoluto”, continúa el co-autor humano de Sumplete. “Hubiera preferido una respuesta reconociendo que el juego se inspiraba en Summer o en Rullo si realmente fue cómo dio con esa idea.” Efectivamente, sería muy deseable que ChatGPT y otras IAs generativas fueran completamente transparentes a la hora de señalar las fuentes de información o inspiración que usan para cada respuesta como lo haría un ser humano, pero quizá eso sería revelar el mecanismo oculto tras el truco de magia que ha encandilado a tantos usuarios. ¿Sería técnicamente posible introducir estos criterios de transparencia en una IA? Joel Lehman, investigador experto en Aprendizaje máquina en la Universidad de Central Florida, y autor del libro: “Why Greatness can’t not be planned”, cree que es posible, pero complicado, sobre todo en algunas instancias actuales de las IA.
Este es un desafío técnico en el que probablemente ya hay muchas personas trabajando. En general, es bastante difícil ahora mismo. Pero para algunas clases de modelos es un poco más fácil. Es el caso, por ejemplo, de los llamados modelos basados en recuperación, que como parte de la construcción de una respuesta recuperan directamente cierta información de un conjunto de datos. WebGPT, y creo que Sparrow de DeepMind también puede hacer esto. En otras palabras, cuando la IA recupera directamente esa información, se puede suponer razonablemente que dicha información recuperada proporcionará de manera más confiable la base de la respuesta.
En Gizmodo hemos contactado también con Daniel Tait y con OpenAI, la compañía tras ChatGPT, por si pueden aclarar algo más este punto, así como para preguntarles en qué iniciativas están trabajando para mejorar la transparencia de su popular Chatbot. Ampliaremos este artículo en cuanto obtengamos una respuesta.
Actualizado el 12/03/2023 a las 12:30 CET: Añadidas declaraciones de Joel Lehman, investigador experto en IA.