Cómo una desconocida startup china llamada DeepSeek logró desafiar el dominio de Silicon Valley con una IA que aprendió a razonar de una forma inesperada

En apenas unos meses, DeepSeek pasó de ser un nombre anónimo en China a convertirse en un desafío global para los gigantes tecnológicos. Su modelo R1 no solo sorprendió por los resultados, sino por la técnica poco convencional que reveló un nuevo camino en la inteligencia artificial.

En enero de este año, el nombre de DeepSeek irrumpió con fuerza en titulares internacionales. Su modelo R1, gratuito y de código abierto, alcanzó un nivel de rendimiento que puso en jaque a gigantes de Silicon Valley. Ahora, con la publicación de un artículo en Nature, conocemos la historia completa: una combinación inesperada de audacia, ingenio y un método de aprendizaje que alteró las reglas del juego.

Reinventar el aprendizaje de las máquinas

Los secretos ocultos detrás de DeepSeek, la IA china que desafió a Silicon Valley — © Deepseek.

La IA generativa —capaz de producir textos, imágenes o incluso música a partir de simples instrucciones— se ha construido en la última década sobre el aprendizaje profundo. Lo habitual hasta ahora era recurrir al aprendizaje supervisado: entrenar modelos con millones de ejemplos humanos y corregirlos hasta que aprendieran a imitar.

DeepSeek decidió saltarse este guion. Su apuesta fue el aprendizaje por refuerzo, un método que se asemeja a cómo un niño descubre las reglas de un videojuego: prueba, falla, aprende y mejora. El modelo no recibía instrucciones claras, solo objetivos, y debía encontrar por sí mismo la mejor manera de alcanzarlos. El resultado fue un rendimiento sorprendente, especialmente en matemáticas y programación.

Entre la experimentación y el caos

El enfoque tenía un precio. El sistema, sin correcciones humanas, producía respuestas extrañas: textos que mezclaban inglés y chino o explicaciones de hasta 10.000 palabras que resultaban poco prácticas para el usuario. Para equilibrar precisión y claridad, los investigadores incorporaron una dosis de aprendizaje supervisado. Así nació un híbrido que combinaba lo mejor de dos mundos: razonamiento emergente y control humano.

Wenfeng Liang, uno de los científicos detrás del proyecto, explicó que los sesgos humanos pueden limitar la creatividad del modelo: “Si lo guiamos demasiado, evitamos que explore caminos propios”. La clave estaba en dejar espacio a la máquina para desarrollar nuevas formas de razonamiento, aunque estas no siempre fueran fáciles de entender.

La eficiencia como bandera

DeepSeek también innovó en otro frente: el ahorro de recursos. En lugar de construir un modelo desde cero, recurrió a la técnica del destilado de modelos, aprovechando estructuras ya existentes para entrenar al R1 con menos energía y costes. Además, descubrieron que podían impulsar el razonamiento del sistema con pocos ejemplos muy bien diseñados, en lugar de enormes cantidades de datos.

Esta estrategia permitió que, en un contexto de restricciones tecnológicas y sin acceso a chips de última generación, DeepSeek lograra un modelo competitivo y sostenible. Para sus autores, el éxito del aprendizaje reforzado abre la puerta a una nueva generación de inteligencias artificiales más autónomas y adaptables.

¿Hacia un nuevo paradigma?

La publicación en Nature no solo valida el trabajo de esta startup desconocida hasta hace unos meses, sino que también plantea interrogantes profundos. ¿Qué significa “razonar bien” en una IA? ¿Importa más la explicación que ofrece o la precisión de su respuesta final?

DeepSeek ha demostrado que desafiar el consenso y buscar caminos alternativos puede alterar el tablero global de la inteligencia artificial. Y lo hizo desde un lugar inesperado, recordando que la innovación no siempre depende de contar con los mayores recursos, sino de atreverse a cuestionar las reglas establecidas.

Cómo una desconocida startup china llamada DeepSeek logró desafiar el dominio de Silicon Valley con una IA que aprendió a razonar de una forma inesperada

Reinventar el aprendizaje de las máquinas

Entre la experimentación y el caos

La eficiencia como bandera

¿Hacia un nuevo paradigma?

Lo último

Lo encontraron dentro de una antigua letrina medieval y nadie esperaba algo así. Un pequeño cuaderno oculto bajo tierra conservó textos escritos hace más de 700 años en un estado casi imposible

Podrá observarse hoy un asteroide del tamaño de una casa, que se pasará “extremadamente cerca” de la Tierra

Xiaomi POCO C85 es casi 2 veces más barato que los Apple AirPods Pro, uno de los smartphones Android más baratos en Amazon

El thriller donde bajar de la montaña significa morir: un mundo dominado por criaturas invisibles

Europa y China están a punto de lanzar una misión espacial que llevaba años retrasándose. SMILE intentará observar por primera vez cómo el viento solar golpea y deforma el escudo invisible que protege a la Tierra

Amazon liquida el cargador UGREEN de 100W a su precio más bajo de la historia con puertos USB-A y USB-C

El metroidvania donde el tiempo lo cambia todo: cada cinco días el mundo deja de ser el mismo

Abuchean al ex CEO de Google Eric Schmidt durante su discurso ante universitarios

Artículos relacionados

Cómo una desconocida startup china llamada DeepSeek logró desafiar el dominio de Silicon Valley con una IA que aprendió a razonar de una forma inesperada

Reinventar el aprendizaje de las máquinas

Entre la experimentación y el caos

La eficiencia como bandera

¿Hacia un nuevo paradigma?

Lo encontraron dentro de una antigua letrina medieval y nadie esperaba algo así. Un pequeño cuaderno oculto bajo tierra conservó textos escritos hace más de 700 años en un estado casi imposible

Podrá observarse hoy un asteroide del tamaño de una casa, que se pasará “extremadamente cerca” de la Tierra

Xiaomi POCO C85 es casi 2 veces más barato que los Apple AirPods Pro, uno de los smartphones Android más baratos en Amazon

El thriller donde bajar de la montaña significa morir: un mundo dominado por criaturas invisibles

Europa y China están a punto de lanzar una misión espacial que llevaba años retrasándose. SMILE intentará observar por primera vez cómo el viento solar golpea y deforma el escudo invisible que protege a la Tierra

Amazon liquida el cargador UGREEN de 100W a su precio más bajo de la historia con puertos USB-A y USB-C

El metroidvania donde el tiempo lo cambia todo: cada cinco días el mundo deja de ser el mismo

Abuchean al ex CEO de Google Eric Schmidt durante su discurso ante universitarios

Artículos relacionados

Europa y China están a punto de lanzar una misión espacial que llevaba años retrasándose. SMILE intentará observar por primera vez cómo el viento solar golpea y deforma el escudo invisible que protege a la Tierra

Abuchean al ex CEO de Google Eric Schmidt durante su discurso ante universitarios

En 2025 se lanzaron al espacio tantos objetos como en los 60 años anteriores juntos. Ahora están cayendo, y no siempre donde deberían

Europa ya produce gas natural sin extraer combustibles fósiles del subsuelo. Una planta situada en Extremadura consigue fabricarlo combinando hidrógeno verde y CO₂ reciclado para inyectarlo directamente en la red energética actual

Nadie sabía qué eran esos círculos gigantes ocultos bajo la arena del Sáhara hasta que Google Earth permitió verlos desde el espacio. Ahora creen que pertenecieron a una sociedad nómada desaparecida miles de años antes de las pirámides de Egipto

Tiene 15 años, vio tortugas en un lago canadiense y construyó un robot submarino con IA que detecta desastres ambientales con el 96% de precisión