Uno de los usos más prometedores de los sistemas de inteligencia artificial es el reconocimiento de imágenes. Alimentas el sistema con fotos de un objeto hasta que aprende a reconocerlo, pero ¿Qué pasa si le pides a esa IA que encuentre algo en una foto que no tiene nada? La respuesta es que lo imagina, y los resultados son sorprendentes.

Un equipo de investigadores de Google está trabajando en una red neural que identifica imágenes. Se trata de un sistema que emula el funcionamiento de neuronas en diferentes capas (entre 10 y 30). Cuando recibe una imagen, cada capa identifica diferentes parámetros como los bordes, el color, los rasgos característicos, la repetición, etc. La última capa se encarga de determinar qué es el objeto en función de los datos procesados por las anteriores capas y los millones de imágenes similares que ha recibido antes.

Advertisement

En definitiva, lo que hace la red es detectar ciertos rasgos característicos y amplificarlos. Lo cierto es que hay aspectos de este proceso de aprendizaje por capas que no están muy claros, así que el equipo de Google ha tenido la ocurrencia de pedirle a una red neural entrenada para reconocer imágenes que encuentre diferentes objetos en fotos que solo tienen ruido y ninguna forma discernible.

Al recibir una foto en la que solo hay ruido y la tarea de buscar un plátano (sobre estas líneas), la red comienza a alinear píxeles una y otra vez hasta que halla rasgos que coinciden con la fruta. El sistema, en definitiva, interpreta cuáles son los rasgos distintivos de un plátano a partir de la nada. Es un nivel de abstracción propio del ser humano y que casi se corresponde con la imaginación. Al igual que con el plátano, la red logra “imaginar” otros objetos como estrellas de mar, tornillos u hormigas.

Curiosamente, el sistema comete los mismos errores de concepto que podría cometer un niño muy pequeño. al pedirle que interprete unas mancuernas, el sistema las muestra unidas al brazo que las sujeta sencillamente porque no ha visto suficientes imágenes de las pesas sin que nadie las tenga en la mano y cree que brazo y mancuerna forman un todo.

La capacidad para imaginar de la máquina llega a extremos sorprendentes cuando en vez de darle una foto vacía, se le ofrece una imagen normal y se le pide que aisle los elementos que cree importantes. Este es el resultado:

La red neural es capaz incluso de jugar a imaginar formas en las nubes. Cuando se le ofrece una foto del cielo, el sistema encuentra formas que solo podemos calificar como oníricas. Lo mismo pasa cuando se le ofrece una imagen con ruido, se le pide que localice un objeto como un edificio y después se repite el proceso. La red neural añade objetos que ha asociado a otros (por ejemplo, asocia hojas y vegetación con animales, y paisajes con edificios, especialmente pagodas o arcos). Las escenas resultantes son increíbles. Alguna no está muy lejos de un cuadro de El Bosco. Los investigadores de Googe llaman a estas imágenes interpretadas por la red neural “inceptionismos” y tienen toda una galería aquí. A continuación os ofrecemos algunos ejemplos. [Google Research vía The Guardian]

***

Psst! también puedes seguirnos en Twitter, Facebook o Google+ :)