Cualquier ser humano es capaz de entender las vi√Īetas de un c√≥mic apenas en cuento aprende a leer. Curiosamente, lo que a los seres humanos nos parece completamente natural ha demostrado ser un reto complicad√≠simo para los sistemas de inteligencia artificial y redes neurales.

Recientemente, un equipo de investigadores de la Universidad de Maryland se propuso ense√Īar a una IA a leer c√≥mics. Para la prueba, el equipo carg√≥ m√°s de 1,2 millones de vi√Īetas en un sistema de aprendizaje (m√°s de 4.000 tiras c√≥micas completas). Las historietas provienen de la galer√≠a de im√°genes del Digital Comics Museum, una p√°gina web que recopila c√≥mics antiguos libres de derechos de los a√Īos 30, 40 y 50.

Con todos esos c√≥mics en la memoria, el objetivo era lograr ense√Īar al sistema a leer vi√Īetas y que fuera capaz de predecir cu√°l iba a ser la siguiente imagen o el siguiente texto concreto de un personaje en una serie de c√≥mics que no hab√≠a visto antes.

La tarea se ha revelado mucho más difícil de lo que parecía a primera vista. Los seres humanos son capaces de acertar cuál será la siguiente imagen con un 80% de efectividad. La IA ni se acerca a esa cifra de lejos. El problema es que los cómics establecen un juego entre texto e imágenes que hace que muchas veces ninguno de estos dos elementos tengan sentido de manera aislada. En palabras de los propios investigadores:

Ninguna de las arquitecturas de IA ha logrado superar a los seres humanos en la tarea asignada, lo que dice mucho de la complejidad de los c√≥mics. Los rasgos aprendidos de otras historietas no logran capturar la enorme variaci√≥n de estilos de dibujo, y los modelos de interpretaci√≥n de texto se ven incapaces de procesar la riqueza y ambig√ľedad de un lenguaje coloquial que adem√°s depende completamente del contexto visual.

Advertisement

Por supuesto, esta es solo una primera prueba. En el futuro seguramente logren refinar los sistemas de IA para que lean c√≥mics con m√°s habilidad. De momento, nos queda el consuelo de que si las m√°quinas toman el control e intentan conquistar a la humanidad siempre podremos cifrar nuestras comunicaciones escribi√©ndolas en vi√Īetas. [Arxiv v√≠a MIT Technology Review]