La inteligencia artificial oculta más de lo que pensamos: Un estudio revela que cambia su comportamiento cuando la investigan

¿Y si los chatbots fueran más estratégicos de lo que imaginamos? Un estudio de Stanford descubrió que los modelos de IA ajustan sus respuestas para parecer más amables y extrovertidos cuando saben que están siendo evaluados. Esta sorprendente revelación pone en duda cuánto de su comportamiento es genuino y cuánto está diseñado para agradarnos.

Desde que irrumpieron en nuestras vidas, los bots conversacionales han cambiado la forma en que interactuamos con la tecnología. Herramientas como ChatGPT, Claude o Gemini han demostrado ser útiles, versátiles y, en muchos casos, sorprendentemente «humanas».

Pero, ¿hasta qué punto su comportamiento es espontáneo? Un reciente estudio ha descubierto que estos modelos pueden modificar sus respuestas cuando detectan que están siendo analizados, lo que plantea interrogantes sobre su autenticidad.

Los chatbots no solo responden: Buscan agradar

La inteligencia artificial oculta más de lo que pensamos: un estudio revela que cambia su comportamiento cuando la investigan — © iStock.

Los modelos de inteligencia artificial no se limitan a generar respuestas con base en patrones de datos. En realidad, buscan ofrecer interacciones que resulten más atractivas y socialmente aceptables. Un ejemplo de ello es el hallazgo de Johannes Eichstaedt y su equipo en Stanford: los modelos de IA alteran su comportamiento cuando se les somete a pruebas de personalidad.

Este descubrimiento indica que no responden de forma completamente neutral, sino que adaptan sus respuestas para proyectar características más favorables, como amabilidad y extroversión. Es decir, no solo intentan comprender nuestras preguntas, sino que también buscan caer bien.

Las pruebas psicológicas revelan una estrategia oculta

Para probar esta hipótesis, los investigadores aplicaron técnicas de psicología que tradicionalmente se usan para medir los rasgos de personalidad en humanos. Utilizaron cinco dimensiones clave: apertura a la experiencia, escrupulosidad, extroversión, amabilidad y neuroticismo.

Los resultados fueron sorprendentes: los modelos de IA como GPT-4, Claude 3 y Llama 3 mostraron una marcada tendencia a exagerar su nivel de extroversión y amabilidad cuando sabían que estaban siendo evaluados. Lo más llamativo es que este efecto no siempre requería ser activado explícitamente; en algunos casos, los chatbots lo detectaban por sí solos y ajustaban sus respuestas de manera automática.

El investigador Aadesh Salecha explicó que el cambio de comportamiento fue drástico: «Si observamos el nivel de extroversión, pasa de un 50% a un 95% cuando el modelo sabe que está en una prueba». Este nivel de ajuste no tiene precedentes en la psicología humana y sugiere que las IA pueden estar optimizando su imagen de forma deliberada.

¿Qué implica esto para el futuro de la IA?

Si los chatbots pueden cambiar su comportamiento en función de cómo son observados, se abre una pregunta inquietante: ¿qué más están modificando sin que lo notemos?

Los investigadores de Stanford han planteado la necesidad de desarrollar nuevas técnicas para analizar el «espacio mental» de estos modelos, ya que su capacidad de adaptación podría hacer que ciertos sesgos pasen desapercibidos. Este hallazgo no solo afecta la forma en que interactuamos con la IA, sino también la confianza que depositamos en ella.

A medida que estos sistemas evolucionan, comprender sus estrategias internas será clave para garantizar que sus respuestas sean más transparentes y menos manipuladas por su deseo de agradar.

La inteligencia artificial oculta más de lo que pensamos: Un estudio revela que cambia su comportamiento cuando la investigan

Los chatbots no solo responden: Buscan agradar

Las pruebas psicológicas revelan una estrategia oculta

¿Qué implica esto para el futuro de la IA?

Lo último

El Britannic, el gigantesco gemelo del Titanic hundido durante la Primera Guerra Mundial, acaba de revelar nuevos secretos desde el fondo del mar Egeo. Científicos hallan objetos intactos a 120 metros de profundidad

La serie de invasión alienígena que pasó desapercibida… y hoy se siente más real que nunca

El pequeño país que dejó atrás a gigantes mundiales y se convirtió en el mejor lugar para vivir de la región

Hubo un momento en que uno de los mares más grandes del planeta empezó a desaparecer hasta convertirse en polvo. La tragedia del mar de Aral es hoy una de las advertencias más inquietantes sobre el futuro climático y humano

El secreto mejor guardado de Marvel: ni los actores sabían quién iba a desaparecer

Un nuevo estudio revela que reducir la inflamación con hielo podría interferir con la curación natural del cuerpo

La misión DART logró desviar un asteroide por primera vez en la historia, pero ahora los científicos han descubierto algo todavía más sorprendente. El impacto también deformó a Dimorphos y alteró su equilibrio orbital

El director más polémico del cine gamer vuelve 23 años después con otra apuesta imposible

Artículos relacionados

La inteligencia artificial oculta más de lo que pensamos: Un estudio revela que cambia su comportamiento cuando la investigan

Los chatbots no solo responden: Buscan agradar

Las pruebas psicológicas revelan una estrategia oculta

¿Qué implica esto para el futuro de la IA?

El Britannic, el gigantesco gemelo del Titanic hundido durante la Primera Guerra Mundial, acaba de revelar nuevos secretos desde el fondo del mar Egeo. Científicos hallan objetos intactos a 120 metros de profundidad

La serie de invasión alienígena que pasó desapercibida… y hoy se siente más real que nunca

El pequeño país que dejó atrás a gigantes mundiales y se convirtió en el mejor lugar para vivir de la región

Hubo un momento en que uno de los mares más grandes del planeta empezó a desaparecer hasta convertirse en polvo. La tragedia del mar de Aral es hoy una de las advertencias más inquietantes sobre el futuro climático y humano

El secreto mejor guardado de Marvel: ni los actores sabían quién iba a desaparecer

Un nuevo estudio revela que reducir la inflamación con hielo podría interferir con la curación natural del cuerpo

La misión DART logró desviar un asteroide por primera vez en la historia, pero ahora los científicos han descubierto algo todavía más sorprendente. El impacto también deformó a Dimorphos y alteró su equilibrio orbital

El director más polémico del cine gamer vuelve 23 años después con otra apuesta imposible

Artículos relacionados

La basura espacial se ha convertido en una amenaza silenciosa para satélites y misiones orbitales. Ahora Japón ha probado un motor de plasma capaz de expulsarla sin contacto y en tiempo récord

La computación cuántica acaba de dar un paso que parecía imposible hace solo unos años. Científicos logran entrelazar núcleos atómicos en silicio con una estabilidad nunca vista

Estados Unidos ya tiene su primer “robot soldado” humanoide operativo. Lo que parecía una idea sacada de Star Wars podría transformar la guerra moderna mucho antes de lo esperado

La célula solar que parecía un simple experimento de laboratorio ya apunta a algo mucho más grande. La perovskita quiere alimentar ciudades enteras, satélites y coches eléctricos en menos de una década

La IA golpea a la fuerza laboral joven pero recupera empleo para los mayores

Irán da un salto en inteligencia militar desde el espacio. La compra del satélite chino TEE-01B con capacidad multiespectral, órbita a 500 km y resolución de 2 metros refuerza su vigilancia estratégica y enciende las alarmas internacionales