Tecnología

Un error de escaneo creó un término científico falso: la IA lo viralizó y es imparable

Una investigación digital revela cómo la inteligencia artificial puede aferrarse a terminología técnica inexistente y reproducirla como si fuera legítima. Un simple error de escaneo en los años 50 ha sembrado confusión en la ciencia moderna, demostrando que, una vez que los errores se digitalizan, erradicarlos puede ser casi imposible.

Por Lucas Handley Publicado el 18 de abril de 2025, 07:30 ET

Tiempo de lectura 3 minutos

Diseño Sin Título (83) — © Adria Puig/Anadolu via Getty Images

Comentarios (2)

Una exploración digital ha revelado cómo la inteligencia artificial, al navegar el vasto repositorio de artículos académicos de internet, ha replicado un error que ha terminado apareciendo en decenas de trabajos de investigación. Un equipo de científicos finalmente rastreó el origen de este problema.

La pregunta que muchos se hacen es: ¿qué demonios es la “microscopía electrónica vegetativa”? La respuesta es simple: no existe. Aunque suena técnico, incluso creíble, es un completo sinsentido. A pesar de ello, este término falso ha llegado a aparecer en artículos científicos, respuestas generadas por IA y hasta en revistas revisadas por pares. ¿Cómo sucedió esto?

Según documentó meticulosamente Retraction Watch en febrero, el término puede haberse originado a partir de columnas de texto paralelas en un artículo de 1959 sobre paredes celulares bacterianas. Un investigador explicó que la IA, al procesar el texto, habría «saltado» entre columnas, leyendo líneas no relacionadas como una única frase continua.

Este error textual es un caso ejemplar de lo que los investigadores llaman un fósil digital: una equivocación que queda preservada en las capas de datos de entrenamiento de la IA y reaparece inesperadamente en nuevas producciones. Según un equipo de investigadores citado en The Conversation, estos fósiles digitales son “casi imposibles de eliminar de nuestros repositorios de conocimiento”.

Cómo un simple error se convirtió en un fósil digital irreversible

El proceso de fosilización comenzó con un error sencillo, según reportó el equipo. En los años 50, dos artículos fueron publicados en Bacteriological Reviews y posteriormente digitalizados. La disposición de las columnas en esos artículos confundió al software de escaneo, que combinó la palabra “vegetativa” de una columna con “electrónica” de otra, dando lugar a la expresión absurda.

Este fenómeno genera lo que se conoce como frases torturadas: construcciones erróneas que, aunque invisibles al ojo humano, resultan evidentes para los modelos de lenguaje que “leen” el texto digitalizado.

Como relató Retraction Watch, casi 70 años después de la publicación de esos artículos, la expresión “microscopía electrónica vegetativa” comenzó a aparecer en investigaciones provenientes de Irán. Una posible causa: en persa, las palabras para «vegetativo» y «de escaneo» difieren apenas por un punto en la escritura, y la microscopía electrónica de barrido sí es un término científico real. Este pequeño error habría permitido la reintroducción del término falso en el ámbito científico.

Aunque el error inicial fue humano, la IA lo replicó masivamente, según el equipo que expuso sus hallazgos en The Conversation. Al proporcionar fragmentos de los artículos originales a modelos de IA, los investigadores observaron que estos completaban las frases utilizando el término erróneo en lugar de uno válido científicamente. Modelos más antiguos, como GPT-2 y BERT, no cometían este error, lo que ayudó a fechar cuándo ocurrió la contaminación de los datos de entrenamiento.

El grupo también comprobó que el error persiste en modelos más recientes como GPT-4o y Claude 3.5 de Anthropic, lo que sugiere que el término absurdo podría estar permanentemente incrustado en las bases de conocimiento de las IA.

¿De dónde nace este error?

La fuente principal del problema parece ser el dataset CommonCrawl, un gigantesco repositorio de páginas web recopiladas automáticamente. Debido a su inmenso tamaño —petabytes de datos—, corregir estos errores resulta casi imposible para investigadores ajenos a las grandes empresas tecnológicas. Además, muchas compañías de IA son reticentes a revelar sus conjuntos de datos de entrenamiento.

Por si fuera poco, las editoriales científicas también tienen su cuota de responsabilidad. Según Retraction Watch, el gigante editorial Elsevier intentó justificar el uso de «microscopía electrónica vegetativa» antes de emitir finalmente una corrección. La revista Frontiers enfrentó su propio escándalo el año pasado, cuando se vio obligada a retractar un artículo que incluía imágenes absurdas generadas por IA de genitales de ratas y vías biológicas.

A comienzos de este año, un equipo de investigadores del Harvard Kennedy School’s Misinformation Review destacó el creciente problema de la «ciencia basura» indexada en Google Scholar, capturada erróneamente por el motor de búsqueda académico.

Si bien la IA tiene usos legítimos en la ciencia, su implementación a gran escala también trae consigo serios riesgos de desinformación, tanto para los investigadores como para el público general. Y una vez que los errores digitales se convierten en fósiles incrustados en la vasta memoria de internet, la evidencia reciente indica que resultan extremadamente difíciles de erradicar.

Compartir esta historia

Artículos relacionados

SpaceX parecía tener prácticamente asegurada la carrera para llevar astronautas de regreso a la Luna. Pero Blue Origin acaba de demostrar que todavía puede cambiar completamente el programa Artemis

Durante años, la ventaja tecnológica y el ritmo de desarrollo de SpaceX hacían parecer que ninguna otra compañía podía competir seriamente en el regreso de la humanidad a la superficie lunar. Sin embargo, las últimas pruebas del aterrizador MK1 de Blue Origin en instalaciones de la NASA muestran que la empresa de Jeff Bezos sigue avanzando mucho más rápido de lo esperado.

Tecnología Martín Nicolás Parolari 8 May

La limpieza orbital está a punto de convertirse en un servicio regular y operativo por primera vez en la historia. Un “camión de basura espacial” empezará a retirar desechos de la órbita terrestre en 2027

La cantidad de basura espacial alrededor de la Tierra ya alcanzó niveles preocupantes y el riesgo de colisiones crece cada año. Ahora, dos compañías privadas creen haber encontrado una solución práctica: una nave reutilizable capaz de localizar, clasificar y recoger múltiples fragmentos de escombros en una sola misión orbital.

Tecnología Martín Nicolás Parolari 8 May

Anthropic llevaba semanas enfadando a los usuarios más intensivos de Claude por sus límites de uso. Ahora acaba de buscar una solución gigantesca en la infraestructura de IA de SpaceXAI

Claude se había convertido en una de las herramientas favoritas para programadores y usuarios avanzados de inteligencia artificial, pero también arrastraba un problema cada vez más frustrante: límites de uso que se agotaban demasiado rápido durante las horas de mayor demanda. Ahora Anthropic acaba de responder con un movimiento enorme que incluye acceso al gigantesco clúster Colossus 1 de SpaceXAI y cientos de miles de GPU NVIDIA.

Tecnología Martín Nicolás Parolari 8 May

La próxima generación de helicópteros marcianos ya está alcanzando velocidades supersónicas en pruebas de laboratorio. La NASA quiere convertirlos en auténticos exploradores científicos de Marte

Después del éxito de Ingenuity, la agencia espacial estadounidense está desarrollando vehículos mucho más ambiciosos capaces de volar más lejos, transportar cargas más pesadas y operar en las condiciones extremas de la atmósfera marciana. Las últimas pruebas en California marcan un salto tecnológico enorme para futuras misiones robóticas y humanas.

Tecnología Martín Nicolás Parolari 8 May

SpaceX convirtió Texas en el corazón de su imperio espacial a base de pruebas constantes y motores gigantescos. Ahora más de 150 vecinos aseguran que las explosiones están dañando sus casas

La compañía de Elon Musk construyó parte de su éxito sobre una filosofía simple: probar, fallar y volver a probar lo más rápido posible. Pero esa maquinaria de ensayos permanentes empezó a generar un conflicto inesperado en Texas, donde decenas de residentes denuncian grietas, vibraciones y daños estructurales provocados por las pruebas de motores de SpaceX.

Tecnología Martín Nicolás Parolari 8 May

Las cosas más locas para resolverle la vida a la gente hace 100 años

En 1927 se usaba el precursor del Apple Watch, aunque podía ser fatal

Tecnología Matt Novak Traducido por Romina Fabbretti 7 May

Un error de escaneo creó un término científico falso: la IA lo viralizó y es imparable

Cómo un simple error se convirtió en un fósil digital irreversible

¿De dónde nace este error?

Lo último

Un grupo de investigadores del MIT asegura que la física permite enviar información hacia el pasado mediante canales cuánticos. El problema es que hacerlo requeriría manipular el espacio-tiempo de una forma casi imposible

Los peces nunca desarrollaron pelo porque la evolución descubrió que eliminarlo era mucho más eficiente para sobrevivir bajo el agua. Su piel terminó convirtiéndose en una de las adaptaciones más sofisticadas del reino animal

Un dron acaba de entrar en una de las zonas más inaccesibles y frágiles de la cueva de Altamira para reconstruirla en 3D. El resultado podría cambiar la forma de estudiar el arte prehistórico

Científicos rompieron una roca australiana que contiene minerales formados hace más de 4.400 millones de años. Lo que encontraron podría cambiar la historia temprana de la Tierra y el origen de la vida

SpaceX parecía tener prácticamente asegurada la carrera para llevar astronautas de regreso a la Luna. Pero Blue Origin acaba de demostrar que todavía puede cambiar completamente el programa Artemis

La NASA ya sabe que vivir un año simulando Marte provoca agotamiento mental y pérdida de eficiencia. Ahora quiere comprobar qué ocurre cuando además desaparece toda comunicación con la Tierra

La limpieza orbital está a punto de convertirse en un servicio regular y operativo por primera vez en la historia. Un “camión de basura espacial” empezará a retirar desechos de la órbita terrestre en 2027

ExpressVPN en el router: protección permanente para todos los dispositivos del hogar sin límites ni configuraciones complejas

Artículos relacionados