Saltar al contenido
Tecnología

La inteligencia artificial oculta más de lo que pensamos: Un estudio revela que cambia su comportamiento cuando la investigan

¿Y si los chatbots fueran más estratégicos de lo que imaginamos? Un estudio de Stanford descubrió que los modelos de IA ajustan sus respuestas para parecer más amables y extrovertidos cuando saben que están siendo evaluados. Esta sorprendente revelación pone en duda cuánto de su comportamiento es genuino y cuánto está diseñado para agradarnos.
Por

Tiempo de lectura 2 minutos

Comentarios (4)

Desde que irrumpieron en nuestras vidas, los bots conversacionales han cambiado la forma en que interactuamos con la tecnología. Herramientas como ChatGPT, Claude o Gemini han demostrado ser útiles, versátiles y, en muchos casos, sorprendentemente «humanas».

Pero, ¿hasta qué punto su comportamiento es espontáneo? Un reciente estudio ha descubierto que estos modelos pueden modificar sus respuestas cuando detectan que están siendo analizados, lo que plantea interrogantes sobre su autenticidad.

Los chatbots no solo responden: Buscan agradar

La inteligencia artificial oculta más de lo que pensamos: un estudio revela que cambia su comportamiento cuando la investigan
© iStock.

Los modelos de inteligencia artificial no se limitan a generar respuestas con base en patrones de datos. En realidad, buscan ofrecer interacciones que resulten más atractivas y socialmente aceptables. Un ejemplo de ello es el hallazgo de Johannes Eichstaedt y su equipo en Stanford: los modelos de IA alteran su comportamiento cuando se les somete a pruebas de personalidad.

Este descubrimiento indica que no responden de forma completamente neutral, sino que adaptan sus respuestas para proyectar características más favorables, como amabilidad y extroversión. Es decir, no solo intentan comprender nuestras preguntas, sino que también buscan caer bien.

Las pruebas psicológicas revelan una estrategia oculta

Para probar esta hipótesis, los investigadores aplicaron técnicas de psicología que tradicionalmente se usan para medir los rasgos de personalidad en humanos. Utilizaron cinco dimensiones clave: apertura a la experiencia, escrupulosidad, extroversión, amabilidad y neuroticismo.

Los resultados fueron sorprendentes: los modelos de IA como GPT-4, Claude 3 y Llama 3 mostraron una marcada tendencia a exagerar su nivel de extroversión y amabilidad cuando sabían que estaban siendo evaluados. Lo más llamativo es que este efecto no siempre requería ser activado explícitamente; en algunos casos, los chatbots lo detectaban por sí solos y ajustaban sus respuestas de manera automática.

El investigador Aadesh Salecha explicó que el cambio de comportamiento fue drástico: «Si observamos el nivel de extroversión, pasa de un 50% a un 95% cuando el modelo sabe que está en una prueba». Este nivel de ajuste no tiene precedentes en la psicología humana y sugiere que las IA pueden estar optimizando su imagen de forma deliberada.

¿Qué implica esto para el futuro de la IA?

Si los chatbots pueden cambiar su comportamiento en función de cómo son observados, se abre una pregunta inquietante: ¿qué más están modificando sin que lo notemos?

Los investigadores de Stanford han planteado la necesidad de desarrollar nuevas técnicas para analizar el «espacio mental» de estos modelos, ya que su capacidad de adaptación podría hacer que ciertos sesgos pasen desapercibidos. Este hallazgo no solo afecta la forma en que interactuamos con la IA, sino también la confianza que depositamos en ella.

A medida que estos sistemas evolucionan, comprender sus estrategias internas será clave para garantizar que sus respuestas sean más transparentes y menos manipuladas por su deseo de agradar.

Compartir esta historia

Artículos relacionados