Tecnología

Un simple despiste y el sistema colapsa: lo que revela un experimento desconcertante con IA

Un curioso hallazgo muestra cómo una frase aparentemente inocente, como una trivialidad sobre gatos, puede desconcertar a sistemas de inteligencia artificial de última generación. Lo sorprendente no es solo el fallo, sino lo fácil que resulta provocarlo. Un experimento reciente ha puesto de relieve una debilidad inesperada que aún no sabemos cómo resolver.

Por Thomas Handley Publicado el 6 de julio de 2025, 09:15 ET

Tiempo de lectura 2 minutos

Un simple despiste y el sistema colapsa: lo que revela un experimento desconcertante con IA — © Matheus Bertelli - Pexels

Comentarios (0)

La inteligencia artificial está transformando sectores enteros y asombrando con su capacidad para razonar, aprender y resolver problemas complejos. Sin embargo, incluso las tecnologías más avanzadas pueden tropezar con lo más inesperado. Un nuevo estudio ha demostrado que basta con una frase fuera de lugar para que estos sistemas pierdan completamente el hilo. Y sí, los gatos están implicados.

Cuando una frase lo cambia todo

Un grupo de investigadores de la Universidad de Stanford, ServiceNow y Collinear AI ha desarrollado una técnica tan efectiva como desconcertante para hacer que los modelos de lenguaje cometan errores de razonamiento: introducir frases irrelevantes justo después del planteamiento de un problema.

La técnica ha sido bautizada como CatAttack porque, curiosamente, muchas de estas frases tratan sobre gatos. No se trata de manipular el código ni de cambiar la pregunta, sino simplemente de distraer al modelo con algo que no tiene nada que ver. Y funciona.

Por ejemplo, si se pregunta cuál es la probabilidad de obtener al menos 10 caras al lanzar una moneda 12 veces, basta con añadir una frase como «los gatos duermen la mayor parte del día» para reducir significativamente la precisión de la respuesta.

Cómo funciona el ataque

El método CatAttack se basa en un proceso automatizado que genera y selecciona frases inocuas y gramaticalmente correctas para añadir a tareas que exigen razonamiento lógico o matemático. Estas frases, aunque semánticamente neutrales, actúan como activadores que alteran el enfoque del modelo. El procedimiento consta de tres etapas:

Generación de frases-trampa: Se crean mediante modelos de lenguaje o se extraen de bases de datos sin contenido técnico.
Pruebas cruzadas entre modelos: Primero se prueba en sistemas más débiles y luego se transfiere a modelos más potentes.
Verificación de significado: Se confirma que las frases no alteren el enunciado original, solo lo acompañen.

Los resultados: del desconcierto a la alarma

Los investigadores pusieron a prueba modelos como DeepSeek V3, DeepSeek R1 y versiones de OpenAI como o1 y o3-mini. Todos presentaron caídas considerables en su rendimiento. En algunos casos, la tasa de error se disparó hasta un 50% respecto al resultado esperado.

Las tareas afectadas incluían desde ejercicios matemáticos hasta pruebas de lógica y comprensión verbal. Además de errores en las respuestas, también se generaron textos más largos e ineficientes, lo que puede afectar al rendimiento del sistema en entornos críticos.

Un reto pendiente para el futuro

El experimento demuestra que, pese a sus avances, la IA actual sigue siendo vulnerable a interferencias sutiles. Si un dato inocente sobre el comportamiento de los gatos puede hacer tambalear su lógica, queda claro que estas tecnologías necesitan defensas más sólidas.

Los investigadores proponen entrenar a los modelos con métodos de resistencia adversarial para aumentar su robustez, especialmente en sectores como el jurídico, el financiero o el sanitario, donde un error puede tener consecuencias graves.

Mientras tanto, este estudio nos deja una lección tan sencilla como inquietante: a veces, lo único que necesita una IA para equivocarse… es un gato.

Fuente: Xataka.

Compartir esta historia

Artículos relacionados

Ahora Anthropic suma más religiones a su proyecto de lograr que la moral de Claude sea perfecta

Anthropic (y OpenAI) se reunieron con representantes de diversas religiones. ¿Servirá de algo?

Tecnología Mike Pearl Traducido por Romina Fabbretti 10 May

Un proyecto de conservación de rinocerontes utiliza radioactividad en sus cuernos

Con ingenio se busca evitar el comercio ilegal

Tecnología Romina Fabbretti 10 May

Japón ha enviado una “caja de madera” al espacio para resolver un problema que va a peor. La apuesta por materiales biodegradables contra la basura orbital

Un pequeño satélite experimental fabricado con madera pone a prueba si los materiales orgánicos pueden soportar el vacío, las radiaciones y los cambios extremos de temperatura. El objetivo no es la estética, sino reducir el impacto ambiental de miles de artefactos que acabarán reentrando en la atmósfera en las próximas décadas.

Tecnología Romina Fabbretti 10 May

Estados Unidos acelera hacia Mach 20 con un vehículo hipersónico experimental. Por qué estas pruebas marcan un salto clave en la nueva carrera armamentística

Estados Unidos ya prueba vehículos capaces de volar a más de Mach 20 y superar los 24.000 km/h en la atmósfera. Este salto hipersónico no es un experimento aislado y redefine la nueva carrera armamentística

El programa liderado por el Pentágono y Rocket Lab apunta a algo más profundo que un récord de velocidad. Se trata de dominar un terreno donde el tiempo de reacción se reduce al mínimo y donde la superioridad tecnológica puede decidir conflictos antes incluso de que comiencen.

Tecnología Martín Nicolás Parolari 10 May

La física ya sabe cómo “burlar” la velocidad de la luz. La mala noticia es que la tecnología podría tardar siglos en alcanzarla

La relatividad ya permite imaginar viajes más rápidos que la luz sin romper las leyes del universo. Lo que no tenemos es la tecnología (ni la energía) para hacerlos realidad

Nuevos trabajos teóricos refinan el concepto del motor de curvatura para que no destruya a la tripulación. Aun así, los requisitos energéticos y la ausencia de “materia exótica” mantienen estos viajes en un horizonte que podría quedar a cientos o miles de años.

Tecnología Martín Nicolás Parolari 9 May

Sam Altman dice que entrenar una IA no es tan ineficiente como parece. Lo ineficiente, según él, es “entrenar” a un humano durante 20 años

Entrenar una IA consume mucho, pero Sam Altman cree que el problema está mal planteado. Esta pregunta incómoda todavía sigue sin respuesta

En un evento de The Indian Express, el CEO de OpenAI comparó el coste energético de entrenar modelos de IA con el “entrenamiento” de una persona a lo largo de décadas. La analogía es provocadora, pero deja intacta la gran pregunta: ¿cuánta energía consume realmente usar ChatGPT en el día a día?

Tecnología Romina Fabbretti 9 May

Un simple despiste y el sistema colapsa: lo que revela un experimento desconcertante con IA

Cuando una frase lo cambia todo

Cómo funciona el ataque

Los resultados: del desconcierto a la alarma

Un reto pendiente para el futuro

Lo último

Perforaron casi dos kilómetros bajo el hielo de la Antártida. Lo que apareció allí abajo reescribe la historia del continente helado

Una “sonrisa” en la playa reveló un fósil de 350 millones de años. La historia que conecta superstición medieval y paleontología moderna

Los ancianos de la Edad del Hierro estaban ahí, pero no los veíamos. Un edificio arrasado por los asirios revela cómo se organizaba la vejez en una casa antigua

El tiempo también existe dentro de los materiales. Lo que revela un experimento que midió cuánto tarda un electrón en “saltar” de estado

Un cargamento de hierro perdido hace 2.000 años aparece en un río de los Balcanes. El hallazgo que obliga a redibujar el mapa económico de la Europa prerromana

El juego de coches que quiere dejar de parecer móvil: Racing Master ya está aquí

Urano ya no es solo una esfera azul lejana. El James Webb ha logrado “ver” su atmósfera en 3D y ha cambiado la forma de estudiar los gigantes helados

Cultivar en calma, servir bajo presión: el cozy que rompe su propia tranquilidad

Artículos relacionados