"¬ŅCu√°les son tus pel√≠culas favoritas de ciencia-ficci√≥n?" "Me gustan Star Wars y Matrix", aparece la respuesta tecleada. Estoy tratando de averiguar si hablo con una "persona oculta" en la sala de al lado o con una m√°quina ubicada en alg√ļn lugar del ciberespacio. "¬ŅEst√°s de acuerdo en que las precuelas fueron mal√≠simas?", prosigo. "¬°Desde luego! Deber√≠an disparar a Lucas".

Esa √ļltima respuesta lo dice todo. Solo un fan de carne y hueso de Star Wars podr√≠a estar tan cabreado por La Amenaza Fantasma.

As√≠ fue uno de los intercambios m√°s f√°ciles de analizar que tuve como el juez J-18 durante el pasado "marat√≥n de test de Turing" en Bletchley Park, Inglaterra. El test est√° pensado para distinguir humanos de m√°quinas mediante rigurosas preguntas realizadas por jueces. Lo dise√Ī√≥ hace 60 a√Īos Alan Turing, el abuelo de los ordenadores, cuyo trabajo en Hut #8 en Bletchley Park jug√≥ un papel fundamental en el esfuerzo de los Aliados para descifrar los c√≥digos de los alemanes durante la Segunda Guerra Mundial.

El Marat√≥n del pasado fin de semana, junto a eventos similares en todo el mundo, se organiz√≥ en celebraci√≥n del centenario de Turing. Pero, ¬Ņc√≥mo es ser juez en un test de Turing? Ansioso por conocerlo, me apunt√© con meses de antelaci√≥n al evento de Bletchley Park.

Advertisement

La idea es similar a interrogar a un espía: si haces las suficientes preguntas, al final el sospechoso se delata. Tal y como Turing pensó el test, tendrías a una persona oculta tras un pantalla opaca y a un ordenador oculto tras otro panel. Un juez se sentaría frente a ambos sin posibilidad de saber quién o qué cosa se esconde detrás de cada pantalla. El juez puede preguntar a ambas entidades; ellas responden a través de un chat de texto. Si la máquina es buena produciendo respuestas parecidas a las de un humano de forma que el juez no pueda distinguir una de otra en base a una conversación de cinco minutos, la máquina superaría el test de Turing.

Turing no esperaba que un ordenador enga√Īara a los jueces todo el tiempo, pero especulaba que para el a√Īo 2000 "un interrogador medio no tendr√≠a m√°s del 70% de probabilidad de distinguir uno de otro". Es decir, los programas inform√°ticos ser√≠an capaces de enga√Īar a los jueces en el 30% de los casos. Doce a√Īos despu√©s, el test de este a√Īo se propon√≠a comprobar si por fin hab√≠amos alcanzando esa barrera.*

Advertisement

El test se llevó a cabo en la antigua sala de juegos de la mansión, donde me senté junto a otros jueces de la Sesión 1, cada uno situados frente a un PC normal y corriente. Huma Shah, el organizador del evento, explicó las reglas: habría dos tipos de tests. En una versión, el juez charlaría en un chat con una entidad (persona o máquina) durante cinco minutos. En la otra versión, habría una pantalla partida y los jueces conversarían al mismo tiempo con dos entidades durante 5 minutos, intentando averiguar si una entidad (o las dos) son máquinas.

En varias ocasiones, los ordenadores se delataron casi desde el principio. Si mi interlocutor no pod√≠a responder a una pregunta sencilla, o cambiaba de tema de forma brusca sin raz√≥n aparente, era se√Īal casi segura de estar ante una m√°quina.

Advertisement

En el otro extremo, ten√≠amos a mi casi-seguro humano fan de Star Wars y de los Beatles ("la mejor banda de la historia", dijo) a quien, cuando le ped√≠ escoger entre los Rolling Stones y The Who, respondi√≥ "desde luego los Stones - los Who al final se hicieron demasiado grandilocuentes". Aunque no estaba de acuerdo con el razonamiento - en mi opini√≥n, los Who hicieron gran m√ļsica justo hasta su separaci√≥n a comienzos de los 80 - la respuesta parec√≠a demasiado... bueno, demasiado humana para ser escrita por una m√°quina.

Otras respuestas, sin embargo, fueron mucho m√°s ambiguas. Cuando dije que era de Canad√°, uno respondi√≥ que hab√≠a o√≠do "grandes cosas" sobre Canad√°, excepto que "Quebec era muy francesa". ¬ŅEra eso algo que un ordenador dir√≠a despu√©s de pasar unos milisegundos escaneando la Wikipedia? ¬ŅO se trataba de un humano con una vaga memoria de lo que una vez su profesor de la escuela le dijo sobre Canad√°, tal vez influenciado por alg√ļn prejuicio anti-franc√©s? ¬ŅEra simplemente una persona que se hab√≠a cansado de estar conversando con extra√Īos por chat durante horas?

Cuando dise√Ī√≥ el test, Turing dio por hecho que el buen conocimiento del lenguaje generalmente iba acompa√Īado de la inteligencia. Desde luego, la habilidad ling√ľ√≠stica supone algo m√°s que unir palabras en una frase. Mantener una conversaci√≥n l√≥gica depende de un conjunto de habilidades cognitivas, entre las que est√°n incluso tratar de adivinar lo que est√° pensando la otra persona. Los ni√Īos adquieren estas capacidades cognitivas como parte de su desarrollo diario. Dotar de estas capacidades a una m√°quina es un reto herc√ļleo, y los programadores detr√°s de los chatbots del pasado fin de semana tienen mucho m√©rito por lograr que su creaci√≥n lo hiciera tan bien. El mejor programa, Eugene Goostman, un chatbot con una personalidad de un ni√Īo de 13 a√Īos, estuvo a punto de pasar el test, enga√Īando casi al 30% de los jueces, la marca sugerida por Turing en su informe de 1950.

Advertisement

El marat√≥n del test de Turing demuestra cu√°n complejo es para una m√°quina mantener una conversaci√≥n real. Como Mark Twain hubiera dicho, puedes enga√Īar a algunos de los jueces algunas veces, pero no mucho m√°s. Al menos, no de momento.

(Actualización: este artículo se escribió en 2012 - ver nota debajo*. Ayer, precisamente el chatbot Eugene Goostman superó por primera vez en la historia el test de Turing).

Advertisement

Foto de cierre: Dan Falk

*Este art√≠culo se public√≥ inicialmente en New Scientist en Junio de 2012 y luego en Gizmodo, con permiso expreso de New Scientist. Lo hemos republicado hoy en Gizmodo en Espa√Īol a ra√≠z de la noticia de ayer, sobre un ordenador superando por primera vez el test de Turing. Justo el programa al que hace referencia en el texto Dan Falk, el chatbot Eugene Goostman, es el que ahora ha logrado superar el test de Turing.

***

Psst! también puedes seguirnos en Twitter, Facebook o Google+ :)