Saltar al contenido
Tecnología

Paradójicamente, no es el inglés ni tampoco el chino. El idioma que mejor entiende la inteligencia artificial es uno que casi nadie esperaba

Investigadores de Microsoft y la Universidad de Maryland analizaron 26 lenguas y hallaron que el polaco, seguido del francés, el italiano y el español, domina el lenguaje de la IA. Un resultado tan sorprendente como revelador sobre cómo aprenden los modelos.
Por

Tiempo de lectura 2 minutos

Comentarios (0)

Durante años se dio por hecho que las inteligencias artificiales “pensaban” en inglés. Era lógico: la mayoría de los datos con los que se entrenan provienen de internet, y la red está dominada por ese idioma. Pero un estudio reciente acaba de ponerlo todo patas arriba. El idioma que mejor entienden los modelos de IA no es el inglés ni el chino. Es el polaco.

Un hallazgo que desafía toda lógica

El idioma que derrota al inglés: la IA entiende mejor el polaco (y el español le pisa los talones)
© Unsplash – Caryn Sandoval.

El estudio fue realizado por investigadores de la Universidad de Maryland y Microsoft, quienes analizaron el rendimiento de varios modelos lingüísticos —entre ellos OpenAI, Google Gemini, Llama, DeepSeek y Qwen— al procesar instrucciones y textos en 26 idiomas distintos.

Los resultados fueron sorprendentes: el polaco obtuvo un 88 % de eficacia, seguido del francés (87 %), el italiano (86 %) y el español (85 %). El inglés, por su parte, quedó relegado al sexto lugar con un 83,9 %. Y el chino, pese a su enorme volumen de datos, ocupó el penúltimo puesto.

Los investigadores no esperaban este desenlace. El polaco, con su gramática compleja y declinaciones, se consideraba una lengua especialmente difícil para los humanos. Pero las IA parecen manejarlo con precisión quirúrgica.

“Resulta que los humanos tienen problemas con él, pero no la IA”, ironizó la Oficina Polaca de Patentes en una publicación que celebraba el hallazgo.

El misterio de un idioma “difícil” que la IA domina

El idioma que derrota al inglés: la IA entiende mejor el polaco (y el español le pisa los talones)
© Unsplash – fran innocenti.

¿Cómo puede ser que un idioma con tan poca presencia en la red supere al inglés? Los investigadores sugieren que el polaco tiene estructuras sintácticas muy regulares y un uso consistente de prefijos y sufijos, lo que facilita a los modelos detectar patrones y ejecutar órdenes con mayor precisión.

En otras palabras, aunque haya menos texto disponible, el polaco le da menos ambigüedades a la IA. Y eso es oro para un sistema que depende de patrones estadísticos para “entender”.

El español, por su parte, también se benefició de su regularidad gramatical y de su enorme difusión global, situándose muy cerca del podio.

Un cambio de paradigma silencioso

El resultado de este estudio no solo reordena la jerarquía lingüística de la IA: también plantea una pregunta fascinante. Si las máquinas entienden mejor el polaco o el español que el inglés, ¿podría cambiar eso la manera en que entrenamos o usamos estos modelos?

Los investigadores creen que sí. Las pruebas demuestran que el rendimiento de la IA no depende solo de la cantidad de datos, sino también de la estructura del idioma y su coherencia interna.

En cierto modo, el experimento ha revelado algo más profundo: que el cerebro digital no piensa como el humano. Y quizá por eso, en el lenguaje de las máquinas, Polonia y el español están ganando terreno al imperio del inglés.

Compartir esta historia

Artículos relacionados