El pasado fin de semana, la Universidad de Reading (Reino Unido) nos sorprendi√≥ con una noticia "hist√≥rica", aseguraban. Un programa inform√°tico hab√≠a pasado por primera vez el test de Turing. Como suele ocurrir con hechos "hist√≥ricos", lleg√≥ la controversia. Investigadores y cient√≠ficos se√Īalan ahora que la noticia de la Universidad de Reading es absurda, puro enga√Īo. Otros defienden su validez. ¬ŅQui√©n tiene raz√≥n?

Jose Mar√≠a Pe√Īa, subdirector del Centro de Supercomputaci√≥n y Visualizaci√≥n de la Universidad Polit√©cnica de Madrid (UPM), es uno de los no convencidos. "Esto es una campa√Īa de marketing m√°s que un hito hist√≥rico. Es un peque√Īo avance, pero nada revolucionario. Las universidades, como otras organizaciones, compiten por titulares", explica en conversaci√≥n telef√≥nica con Gizmodo en Espa√Īol.

Como √©l, muchos investigadores y cient√≠ficos creen que lo √ļnico que ha hecho la Universidad de Reading es exagerar. O no contar toda la verdad. ¬ŅPor qu√©? Ah√≠ van algunas razones.

Un test de Turing, cientos de interpretaciones

Advertisement

Empecemos por el problema clave. El test de Turing fue un sistema propuesto en 1951 por el matemático y criptógrafo británico Alan Turing. Su idea inicial era bastante diferente de las pruebas que se realizan en la actualidad.

Turing propuso una prueba en la que un juez trataba de distinguir entre un humano y una m√°quina a trav√©s de un terminal con el que les hac√≠a preguntas. Seg√ļn Turing, si el juez era "menos de un 50% correcto en su distinci√≥n", es decir, si pod√≠a confundir con igual probabilidad un humano y una m√°quina, entonces el programa inform√°tico era una buena simulaci√≥n de la inteligencia humana.

Advertisement

Sin embargo, hoy en d√≠a hay decenas de organizaciones y compa√Ī√≠as hacen los test de Turing con su propia interpretaci√≥n de la idea inicial del matem√°tico brit√°nico. Desde el Premio Loebner, establecido en 1991, hasta este √ļltimo de la Universidad de Reading, que realiz√≥ conversaciones de 5 minutos entre el juez y el humano/m√°quina. En total, 30 jueces y 300 conversaciones. ¬ŅPor qu√© 5 minutos y no 10, o un d√≠a entero? ¬ŅPor qu√© esos 30 jueces y no otros? ¬ŅQui√©n establece las reglas y con qu√© autoridad? Nadie lo sabe ni lo controla. En palabras de Jose Mar√≠a Pe√Īa:

El test inicial de Turing es un postulado teórico. Dependiendo de cómo lo interpretes e implementes, lo puedes utilizar o no para obtener resultados en tu propio beneficio.

Traducido: visibilidad para una Universidad y programadores que pueden aprovechar en negocio o reconocimiento su "hito histórico".

Advertisement

No hay verificación independiente

Al no existir una entidad √ļnica que estandarice y verifique los test de Turing, b√°sicamente cualquiera puede organizar uno y asegurar que se ha batido por primera el test de Turing.

Advertisement

¬ŅQui√©n asegura que los evaluadores seleccionados tienen las cualificaciones necesarias para realizar el test? ¬ŅQu√© comunidad cient√≠fica (y proceso) asegura que los resultados del test de la Universidad de Reading son, efectivamente, correctos? En todo avance cient√≠fico, hay siempre una organizaci√≥n que verifica que ese logro es repetible y acorde con unas ciertas "reglas de juego". Eso no ocurre con los test de Turing.

13 a√Īos y ucraniano, o c√≥mo influenciar el resultado

Es otro de los puntos m√°s discutidos de este test: el programa que lo super√≥, Eugene, part√≠a de la premisa de ser un ni√Īo ucraniano de 13 a√Īos hablando en ingl√©s, idioma en el que no era nativo. Si los evaluadores saben que al otro lado hay un ni√Īo (o una m√°quina) que se comunica en un idioma que no es el suyo propio, se introduce un sesgo a la hora de analizar la validez y complejidad de sus respuestas.

Advertisement

"Para ser correcto, habr√≠a que evaluar sus respuestas con las de un ni√Īo de verdad de 13 a√Īos y ucraniano hablando en ingl√©s. Entonces tal vez ese 30% de acierto no era v√°lido o insuficiente. Son condiciones muy relativas", dice Pe√Īa.

Lo peor: no, no es el primero en "superar" el test

La Universidad de Reading asegur√≥ que el programa Eugene hab√≠a sido el primero en superar el test de Turing. Falso. Primero porque, como hemos explicado, no existe *el* test de Turing, hay muchas interpretaciones del mismo. Pero segundo, y m√°s grave, porque ya en 1964 hubo programas como Eliza, dise√Īado por el MIT, que hicieron algo muy parecido.

Advertisement

"En 1964 hubo un comercial de una compa√Ī√≠a que se pas√≥ un buen rato conversando con el programa Eliza pensando que era una persona. Ahora el software es mucho m√°s complejo, pero pasar una conversaci√≥n de 5 minutos no implica absolutamente nada sobre la inteligencia real del software", explica Jose M¬™ Pe√Īa.

Stevan Harnad, profesor de ciencias cognitivas de la Universidad de Quebec, en Canadá, coincide. "Es una tontería, una completa tontería. No hemos pasado el test de Turing. No estamos ni siquiera cerca", ha dicho a The Guardian.

En definitiva ¬Ņenga√Īo o hito hist√≥rico? Tal vez hay una palabra mejor: marketing.

Advertisement

Ilustración de apertura: Seamartini Graphics/Shutterstock