Aprendizaje automático y videojuegos es una combinación maravillosa. Puedo pasarme horas viendo cómo una red neuronal aprende a conducir en el GTA V o se pone a dar saltos en el Mario 64 hasta conseguir una estrella. Pero siempre llega un punto en el que se vuelve tan buena que empieza a dar miedo.

Tres ingenieros de la Universidad de Freiburg, en Alemania, investigaban un m√©todo para ense√Īar a una inteligencia artificial a navegar por los viejos juegos de Atari cuando descubrieron algo extra√Īo. En su af√°n por conseguir la mayor puntuaci√≥n posible, la IA hab√≠a aprendido a aprovechar un fallo del Q*bert que le permit√≠a¬†acumular puntos infinitos. Seg√ļn ha confirmado el dise√Īador del juego, nadie hab√≠a dado con este error de programaci√≥n desde su publicaci√≥n en 1982.

Advertisement

Normalmente, un jugador de Q*bert salta de cubo en cubo para cambiar el color de todas las plataformas y luego pasa al siguiente nivel. La IA descubri√≥ que pod√≠a terminar el primer nivel con normalidad y despu√©s empezar a dar saltos aparentemente aleatorios entre los cubos para que todas las plataformas empezaran a parpadear. Con este extra√Īo m√©todo lleg√≥ a acumular hasta un mill√≥n de puntos en el tiempo l√≠mite que le otorgaban los investigadores.

Cabe destacar que esta IA no funciona con algoritmos de aprendizaje por refuerzo, como la m√°quina de Google que gan√≥ al campe√≥n de Go, sino con algoritmos evolutivos, una alternativa menos utilizada que compara m√©todos entre s√≠ para ver cu√°l puede completar mejor una tarea determinada y luego a√Īade peque√Īos retoques para ver si les va mejor, y as√≠ mejora lentamente.

Advertisement

[The Verge]