Los modelos de IA de código abierto podrían ser más costosos en el largo plazo, según un estudio

Hay más negocios y compañías que adoptan la IA, pero elegir el modelo suele ser una decisión importante. Aunque los modelos de código abierto parecen menos costosos al principio, un nuevo estudio advierte que el ahorro puede evaporarse pronto debido a la energía extra que requieren.

De hecho los modelos de IA de código abierto utilizan muchos más recursos de computación que sus rivales de código cerrado para una misma tarea, según un trabajo publicado el jueves por Nous Research.

Los investigadores probaron decenas de modelos de IA, incluyendo sistemas cerrados de Google y OpenAI, además de modelos de código abierto de DeepSeek y Magistral. Midieron el esfuerzo de computación que requería cada uno para completar las mismas tareas, en tres categorías: preguntas de conocimiento común, problemas matemáticos, y enigmas de la lógica.

Utilizaron la cantidad de tokens (unidades básicas de texto) que usaba cada modelo para resolver y responder las preguntas en cuanto al consumo de recursos.

“Los modelos de código abierto usan 1,5-4x más tokens que los cerrados, y hasta 10x para preguntas de conocimiento común, lo que hace que sean más caros por pregunta a pesar del costo más bajo por token”, escribieron los autores del trabajo.

La importancia de la eficiencia en tokens

En la IS, un token es una unidad de texto que puede ser una palabra, parte de una palabra, o incluso signos de puntuación que usan los modelos para entender el lenguaje. Los modelos procesan y generan el texto de a un token a la vez, por lo que si usan más tokens, requieren de más potencia de computación y más tiempo.

Como la mayoría de los modelos de código cerrado no revelan su proceso de razonamiento o cadena de pensamiento, los investigadores midieron la eficiencia contando los tokens utilizados. Como los modelos se facturan por cantidad de tokens total utilizada en el proceso de razonamiento y entrega de la respuesta, los tokens sirven como muestra del esfuerzo necesario para producir una respuesta.

Es una consideración importante para las compañías que utilicen IA, por varias razones.

“Primero, aunque los modelos de código abierto sean menos costosos, la ventaja en el costo podría anularse si requieren más tokens para razonar sobre un problema determinado”, indican los investigadores. “En segundo lugar, a mayor cantidad de tokens, más tarda la generación de respuesta, y mayor es la latencia”.

Los modelos cerrados ganan

El estudio halló que los modelos abiertos utilizan siempre más tokens que los modelos cerrados para una misma tarea, en ocasiones el triple, para preguntas de conocimiento común. La brecha se achica a menos del doble para problemas de matemáticas y lógica.

“Los modelos cerrados (OpenAI, Grok-4) optimizan la cantidad de tokens usando menos para recortar costos, mientras los abiertos (DeepSeek, Qwen) usan más tokens, tal vez para razonar mejor”, escriben los autores del trabajo.

Entre los modelos abiertos el más eficiente fue llama-3.3-emotron-super-49b-v1, y los más ineficientes fueron los modelos Magistral.

Los modelos de OpenAI se destacaron. Tanto el 04-mini como los nuevos modelos abiertos gpt-oss demostraron una impactante deficiencia en el uso de tokens, en especial en problemas matemáticos.

Los investigadores señalaron que los modelos gpt-oss de OpenAI, con su cadena concisa, podrían servir como parámetro para mejorar la eficiencia en tokens de otros modelos abiertos.

Los modelos de IA de código abierto podrían ser más costosos en el largo plazo, según un estudio

La importancia de la eficiencia en tokens

Los modelos cerrados ganan

Lo último

Un físico propone que el Big Bang quizá nunca ocurrió como lo imaginamos. Su modelo sostiene que Einstein se queda corto en el primer instante del universo

Abrieron una tumba romana en Egipto esperando hallar momias y amuletos funerarios. Lo más sorprendente apareció dentro de un cuerpo: un fragmento de la Ilíada

Han cartografiado 47 millones de galaxias a lo largo de 11.000 millones de años de historia cósmica. Ahora aparece una señal inquietante: la energía oscura podría no comportarse como creíamos

Un agujero negro situado en nuestra galaxia lanza chorros con una energía equivalente a 10.000 soles y viajan a media velocidad de la luz. Científicos acaban de medir por primera vez su potencia real

Siempre creímos que el tiempo avanza de una sola manera para todos. Científicos ahora proponen comprobar si puede transcurrir más rápido y más lento al mismo tiempo en un mismo reloj

La NASA rompe el silencio respecto de las muertes y desapariciones de científicos vinculados a la tecnología espacial

En los pulmones de un hombre encuentran residuos negros que muestran el peor aspecto de los incendios forestales

La nube consume cada vez más energía y los discos duros envejecen rápido. Científicos ahora proponen un cristal capaz de conservar datos durante más de 10.000 años

Artículos relacionados

Los modelos de IA de código abierto podrían ser más costosos en el largo plazo, según un estudio

La importancia de la eficiencia en tokens

Los modelos cerrados ganan

Un físico propone que el Big Bang quizá nunca ocurrió como lo imaginamos. Su modelo sostiene que Einstein se queda corto en el primer instante del universo

Abrieron una tumba romana en Egipto esperando hallar momias y amuletos funerarios. Lo más sorprendente apareció dentro de un cuerpo: un fragmento de la Ilíada

Han cartografiado 47 millones de galaxias a lo largo de 11.000 millones de años de historia cósmica. Ahora aparece una señal inquietante: la energía oscura podría no comportarse como creíamos

Un agujero negro situado en nuestra galaxia lanza chorros con una energía equivalente a 10.000 soles y viajan a media velocidad de la luz. Científicos acaban de medir por primera vez su potencia real

Siempre creímos que el tiempo avanza de una sola manera para todos. Científicos ahora proponen comprobar si puede transcurrir más rápido y más lento al mismo tiempo en un mismo reloj

La NASA rompe el silencio respecto de las muertes y desapariciones de científicos vinculados a la tecnología espacial

En los pulmones de un hombre encuentran residuos negros que muestran el peor aspecto de los incendios forestales

La nube consume cada vez más energía y los discos duros envejecen rápido. Científicos ahora proponen un cristal capaz de conservar datos durante más de 10.000 años

Artículos relacionados

La nube consume cada vez más energía y los discos duros envejecen rápido. Científicos ahora proponen un cristal capaz de conservar datos durante más de 10.000 años

En 2004 ocupaba salas enteras, consumía recursos gigantescos y era la computadora más poderosa del planeta. Hoy una sola GPU doméstica de NVIDIA ya supera su potencia bruta en varios escenarios

China quiere convertir su estación espacial en una fábrica orbital. Ya diseña un módulo inflable de dos metros para fabricar materiales imposibles en la Tierra

Mientras la inteligencia artificial acapara toda la atención. Los fabricantes de semiconductores de Estados Unidos ya libran otra batalla decisiva: producir chips cuánticos a escala para los ordenadores del futuro

SpaceX quiere convencer al mercado de que su futuro está en los centros de datos orbitales. El problema es que esa promesa aún choca con la física, los costes y el calendario real

Ingenieros crean un material hecho de piezas similares a grapas. Puede comportarse como un bloque sólido y desmontarse en segundos con una simple vibración