La semana pasada, una agencia de publicidad logr√≥ llamar nuestra atenci√≥n con un brazo robot capaz de encontrar a Wally en cuatro segundos. La parte rob√≥tica del sistema no tiene misterio (basta con juntar una Raspberry Pi y una biblioteca de Python para el que brazo responda a tus √≥rdenes), pero la parte inteligente nos ense√Īa c√≥mo funciona el aprendizaje autom√°tico.

El aprendizaje automático es una rama de la inteligencia artificial en la que una máquina aprende a generalizar un comportamiento a partir de una información suministrada en forma de ejemplos. En este caso, la máquina es un modelo probabilístico y la información son 107 imágenes de Wally.

Los modelos probabilísticos se entrenan con datos de entrada para realizar predicciones a partir de datos nuevos; en nuestro ejemplo, imágenes de Wally que el modelo no había visto antes. Entrenar un modelo requiere tiempo, recursos y conocimiento, pero la IA que encuentra a Wally ha sido entrenada en la nube de Google, mediante un servicio llamado Google Auto ML Vision que se encarga de todo (solo hay que mandarle las imágenes).

Advertisement

Dentro de esa caja negra de Google hay un algoritmo de aprendizaje profundo, que es como Google llama a los modelos que combinan aprendizaje automático con redes neuronales (basados en las conexiones nerviosas de los animales). El brazo robot envía una foto de la página del libro de Wally al modelo entrenado, el modelo entrenado estudia las caras mediante aprendizaje profundo y luego toma una decisión basada en estadística bayesiana. Si una de las caras coincide al 97,5% con lo que el algoritmo aprendió que era Wally, entonces es probable que sea Wally.

Este otro vídeo creado por empleados de Google explica de manera sencilla las diferencias entre aprendizaje automático (machine learning), aprendizaje profundo (deep learning) y redes neuronales (neural networks), algunos de los componentes clave de lo que hoy entendemos por inteligencia artificial.

Advertisement

También nos descubre que la inteligencia artificial no es perfecta, y que sigue cometiendo errores que un humano no cometería. Por ejemplo, cuando le preguntas a la red neuronal de Google qué es una mancuerna, te dibuja la imagen de una mancuerna con un brazo humano incorporado.