Cualquier ser humano es capaz de entender las viñetas de un cómic apenas en cuento aprende a leer. Curiosamente, lo que a los seres humanos nos parece completamente natural ha demostrado ser un reto complicadísimo para los sistemas de inteligencia artificial y redes neurales.

Recientemente, un equipo de investigadores de la Universidad de Maryland se propuso enseñar a una IA a leer cómics. Para la prueba, el equipo cargó más de 1,2 millones de viñetas en un sistema de aprendizaje (más de 4.000 tiras cómicas completas). Las historietas provienen de la galería de imágenes del Digital Comics Museum, una página web que recopila cómics antiguos libres de derechos de los años 30, 40 y 50.

Advertisement

Advertisement

Con todos esos cómics en la memoria, el objetivo era lograr enseñar al sistema a leer viñetas y que fuera capaz de predecir cuál iba a ser la siguiente imagen o el siguiente texto concreto de un personaje en una serie de cómics que no había visto antes.

La tarea se ha revelado mucho más difícil de lo que parecía a primera vista. Los seres humanos son capaces de acertar cuál será la siguiente imagen con un 80% de efectividad. La IA ni se acerca a esa cifra de lejos. El problema es que los cómics establecen un juego entre texto e imágenes que hace que muchas veces ninguno de estos dos elementos tengan sentido de manera aislada. En palabras de los propios investigadores:

Ninguna de las arquitecturas de IA ha logrado superar a los seres humanos en la tarea asignada, lo que dice mucho de la complejidad de los cómics. Los rasgos aprendidos de otras historietas no logran capturar la enorme variación de estilos de dibujo, y los modelos de interpretación de texto se ven incapaces de procesar la riqueza y ambigüedad de un lenguaje coloquial que además depende completamente del contexto visual.

Por supuesto, esta es solo una primera prueba. En el futuro seguramente logren refinar los sistemas de IA para que lean cómics con más habilidad. De momento, nos queda el consuelo de que si las máquinas toman el control e intentan conquistar a la humanidad siempre podremos cifrar nuestras comunicaciones escribiéndolas en viñetas. [Arxiv vía MIT Technology Review]