Fotograma de Blade Runner

CAPTCHA es una prueba de Turing inversa, no la realiza un humano, la realiza una m√°quina. Este peque√Īo detalle hac√≠a de la prueba casi imposible de superar para una IA. Desde entonces, el sistema era un est√°ndar en Internet para diferenciarte de las m√°quinas. Hasta ahora.

Probablemente has pasado alguna vez por la prueba, cuyas siglas significan Completely Automated Public Turing test to tell Computers and Humans Apart. Se trata de un peque√Īo y simple (para los humanos) rompecabezas, a menudo molesto, donde se suele pedir que reescribas un texto distorsionado o selecciones las im√°genes que te pide sobre algo en concreto.

Advertisement

Sin embargo, este sistema puede que ya haya dejado de ser tan fiable para diferenciarnos de una IA. Seg√ļn una investigaci√≥n publicada en Science, un nuevo tipo de inteligencia fue capaz de resolver algunos modelos de CAPTCHA con hasta un 66.6% de precisi√≥n. Un CAPTCHA se considera roto si un bot puede pasarlo el 1% del tiempo. As√≠ que parece que el sistema lo ha hecho.

Imagen: Wikimedia Commons

Este tipo de pruebas automatizadas para diferenciar humanos de robots nacieron en la década de los 90 como una forma de prevenir el fraude y el correo no deseado por parte de bots. La idea básica era crear un rompecabezas que fuera fácil de descifrar para un humano, pero difícil para una computadora.

Advertisement

Una m√°quina pod√≠a ser entrenada para reconocer la letra ‚ÄėM‚Äô en cada fuente imaginable, sin embargo, no lo pod√≠a hacer en las formas casi infinitas en que la letra puede distorsionarse desde la fuente original. De hecho, la capacidad de aprender y generalizar a partir de un peque√Īo conjunto de ejemplos es una de las cosas que diferenciaba a nuestros cerebros de las computadoras, y lo que hasta ahora nos permit√≠a resolver CAPTCHA con facilidad.

Imagen: Wikimedia Commons

Seg√ļn Science, los investigadores de la compa√Ī√≠a Vicarious (fundada por Zuckerberg y Bezos, entre otros), han desarrollado un algoritmo que fue capaz de comprender y pasar una prueba CAPTCHA precisamente porque pod√≠a generalizar a partir de un peque√Īo conjunto de ejemplos. La IA de Vicarious puede descifrar una variedad de estilos textuales y hacerlo con eficiencia.

Advertisement

¬ŅC√≥mo? Los investigadores crearon un algoritmo llamado Recursive Cortical Network, el cual toma un CAPTCHA y lo modela como una colecci√≥n de formas y apariencias basados en un pu√Īado de im√°genes con las que ha entrenado. Primero genera modelos basados ‚Äč‚Äčen contornos de letras y apariencias de un grupo de letras de ejemplo no distorsionadas, y luego las usa para determinar probabil√≠sticamente qu√© letra est√° ‚Äúmirando‚ÄĚ en una frase de CAPTCHA distorsionada.

Los resultados son ciertamente abrumadores, El algoritmo tuvo tasas de √©xito del 66.6% en reCAPTCHA, 64.4% en BotDetect, 57.4% en Yahoo o del 57.1% en el sistema de PayPal, y todo ello con ‚Äúmuy pocos datos de entrenamiento‚ÄĚ, seg√ļn los investigadores.

Dicho de otra forma, el éxito de Vicarious en la creación de una red neuronal que puede resolver una gran variedad de CAPTCHA significa que los humanos tienen que empezar a buscar mecanismos de entrenamiento contra los bots más eficientes. [Science vía Motherboard]