Durante años, PewDiePie fue sinónimo de entretenimiento, memes y comentarios culturales. Pero en su último vídeo ha mostrado una faceta muy distinta. Desde su casa en Japón, el creador ha documentado un experimento prolongado en el que pasó de entusiasta del hardware a aprendiz autodidacta de machine learning, con un objetivo claro: no depender de las grandes compañías de IA.
Un objetivo limitado, pero ambicioso
El planteamiento fue pragmático. Felix quería un modelo local, ejecutándose en su propio hardware, optimizado para formatos de programación utilizados por agentes de IA y flujos automatizados. No buscaba conversación natural ni razonamiento general, sino eficiencia quirúrgica en código.
Ese enfoque explica por qué los resultados deben leerse con cuidado. Aun así, el recorrido fue notable.
De un fracaso estrepitoso a cifras que incomodan
Los primeros benchmarks fueron poco alentadores. El modelo apenas alcanzaba un 8 % en una prueba especializada de programación. Tras múltiples ajustes, cambios de dataset y modificaciones de parámetros, el rendimiento subió al 19,6 %, superando brevemente a ChatGPT en esa misma métrica concreta.
El logro duró poco. Felix detectó lo que se conoce como benchmark contamination: su modelo había sido entrenado, sin saberlo, con datos demasiado cercanos a las preguntas del test. Resultado invalidado.
Lejos de esconderlo, lo explicó públicamente. Tras limpiar los datos y reentrenar el sistema sobre una base estrictamente orientada a código, el modelo alcanzó un 36 %, cifra que posteriormente subió al 39,1 % tras ajustes finales de post-entrenamiento. Un resultado que, al menos en ese nicho, lo colocaba al nivel de soluciones comerciales mucho más grandes.
Un laboratorio casero al límite
Nada de esto fue sencillo. El setup utilizado ronda los 20.000 dólares —algunas estimaciones lo sitúan bastante más alto— e incluye diez GPUs NVIDIA trabajando de forma simultánea.
El coste no fue solo económico. Una de las tarjetas gráficas terminó inutilizada por la carga de trabajo, y el propio PewDiePie relató problemas constantes con el suministro eléctrico, cables sobrecalentados y límites de potencia domésticos. Todo el proceso fue bautizado por él mismo como “vibe coding”: ajustar parámetros más por intuición que por manual académico.
¿Supera realmente a ChatGPT?
La respuesta corta es no… y sí, dependiendo de cómo se mire. Tal y como matiza Kotaku, el propio Felix fue claro al poner límites a su logro. Su modelo destaca únicamente en un benchmark muy concreto de programación y no compite en conversación general, razonamiento complejo o creatividad.
Además, el panorama cambia rápido. Modelos recientes como Qwen 3 ya han aparecido con puntuaciones superiores, lo que obliga a una carrera constante de mejoras si se quiere mantener la relevancia.
Por ahora, PewDiePie no ha decidido si hará público su modelo. Prefiere seguir probándolo, afinándolo y explorando otros escenarios antes de dar ese paso. Pero el mensaje ya está ahí: incluso en un campo dominado por gigantes tecnológicos, la experimentación individual todavía puede producir resultados incómodos.