El nuevo thriller de terror del aclamado Ari Aster, Eddington, ha dividido a la audiencia y desatado un intenso debate en línea sobre el mensaje que el director quiere transmitir acerca de nuestra relación colectiva con la tecnología (pista: no parece ser algo bueno). La trama se desarrolla en un pequeño pueblo de Texas que se sumerge en un caos alimentado por las redes sociales durante la pandemia de covid-19. La película cuenta con Joaquin Phoenix en el papel del sheriff Joe Cross, enfrentado al alcalde del pueblo, interpretado por Pedro Pascal, mientras la comunidad entera se enreda en disputas políticas y culturales cada vez más delirantes.
La historia, compleja y plagada de subtramas, incluye un elemento particularmente intrigante: la instalación de un nuevo y polémico centro de datos en las afueras del pueblo. La compañía responsable lleva un nombre peculiar: SolidGoldMagikarp. Todo apunta a que se trata de una referencia a un concepto poco conocido en el mundo del desarrollo de inteligencia artificial: los llamados glitch tokens.
En el entrenamiento de modelos de IA, el proceso de “tokenización” consiste en traducir texto humano a datos numéricos para que los sistemas de lenguaje puedan procesarlo. Para ello, los investigadores alimentan enormes cantidades de texto a programas llamados tokenizers, que convierten las palabras en fragmentos comprensibles para la máquina, llamados tokens. Estos tokens son la base sobre la que se enseña a un modelo de lenguaje a responder a las solicitudes humanas, de manera similar a cómo un sistema de autocorrección aprende patrones de palabras para predecir la siguiente en una secuencia.
Según Jessica Rumbelow, directora ejecutiva de la empresa Leap Labs, los grandes modelos de lenguaje no son más que algoritmos predictivos diseñados para ensamblar texto basándose en los patrones que aprenden. “Literalmente, eso es todo lo que hacen”, dijo a Gizmodo. “Si introduces 1, 2, 3, 4, el modelo aprende a predecir 5”, ejemplificó.
Pero en este proceso existe una excepción: los glitch tokens. Cuando un modelo se encuentra con un token que nunca vio durante su entrenamiento, puede reaccionar de manera inesperada. SolidGoldMagikarp es uno de esos tokens anómalos. Rumbelow y su colega Matthew Watkins lo descubrieron al investigar estos casos extraños. Al introducirlo en un modelo de lenguaje, este podía empezar a generar respuestas incoherentes, frases siniestras, mensajes enigmáticos o incluso mostrarse agresivo hacia el usuario. “Creemos que ocurre porque el modelo no sabe qué hacer con un token que jamás ha procesado antes”, explicó Rumbelow.
Advertencia: posibles spoilers
En pocas palabras, expresiones como SolidGoldMagikarp son términos oscuros capaces de volver “loca” temporalmente a una IA. ¿Cómo se conecta esto con la nueva película de Aster? Es materia de interpretación, pero hay pistas claras.
Las películas de Aster suelen compartir un mismo desenlace: las fuerzas oscuras acaban triunfando y el protagonista termina absorbido por ellas. En Hereditary, la familia Graham se convierte en peón de un ritual demoníaco; en Midsommar, la ira reprimida de Dani es usada como arma contra su pareja; en Beau is Afraid, el personaje principal queda atrapado para siempre en la opresiva red de su madre, reducido a un ritual kafkiano de humillación.
En Eddington, una historia sobre nuestra relación conflictiva con la tecnología, la fuerza oscura triunfante es el propio internet. El centro de datos —manifestación física del poder absoluto de la red sobre nuestras vidas— termina dominando a todos, convirtiendo a los personajes en emisarios, piezas o víctimas de un engranaje imposible de detener. Que Aster haya llamado a ese centro de datos con el nombre de un término capaz de desestabilizar un sistema digital podría ser su forma de señalar lo que la tecnología nos está haciendo a todos mientras se adueña de nuestra existencia… y quizás, una advertencia de lo que aún está por venir.