A pesar de lo potentes que se han vuelto las consolas de videojuegos, incluso los juegos más impresionantes desde el punto de vista gráfico no parecen imágenes fotorrealistas del mundo real, que posiblemente sea el objetivo final. Pero los investigadores de Intel Labs podrían haber encontrado un atajo aplicando técnicas de aprendizaje automático en imágenes de consola para convertirlas de preciosas a fotorrealistas.
Durante las últimas décadas, las capacidades gráficas de las consolas domésticas han avanzado a pasos agigantados. Más potencia de procesamiento en las máquinas permite no solo renderizar más detalles en los modelos 3D que componen una escena, sino también recrear con mayor precisión el comportamiento de la luz para que los reflejos, las luces y las sombras se comporten y se parezcan cada vez más al mundo real.
Pero el hardware no llega al punto en que los videojuegos parezcan tan realistas como los efectos visuales generados por computadora que emplean los taquillazos de Hollywood para sorprender al público. Una consola puede generar 60 cuadros de video a una resolución de 4K por segundo, pero un solo fotograma de una película con efectos complejos generados por computadora puede tardar horas, o incluso días, en renderizarse con resultados fotorrealistas. El streaming de juegos es una solución, ya que poderosas computadoras renderizan en remoto un juego en tiempo real y luego envían cuadros finalizados a través de Internet a la pantalla del jugador, pero esta nueva investigación es aún más inteligente que eso.
Ya hemos visto el uso de aprendizaje automático para transferir el estilo artístico único del trabajo de un pintor famoso a otra imagen, e incluso a videos en movimiento, y eso no es del todo diferente a lo que está pasando en esta investigación. Pero en lugar de entrenar una red neuronal con obras famosas, los investigadores de Intel Labs se basaron en Cityscapes Dataset, una colección de imágenes del centro urbano de una ciudad alemana capturadas por la cámara de un automóvil, para el entrenamiento.
Cuando se aplica un estilo artístico diferente al original utilizando técnicas de aprendizaje automático, los resultados a menudo son temporalmente inestables, lo que significa que cuadro a cuadro aparecen y desaparecen artefactos extraños que disminuyen el realismo de los resultados. Con este nuevo enfoque, los efectos renderizados no exhiben ninguno de esos artefactos porque, además de procesar la imagen renderizada por el motor de juego de Grand Theft Auto V, la red neuronal también usa otros datos renderizados a los que el motor del juego tiene acceso, como la profundidad de objetos en una escena e información sobre cómo se procesa y renderiza la iluminación.
Eso es una simplificación burda, pero puedes leer una explicación más detallada de la investigación aquí. Los resultados son notablemente fotorrealistas. La superficie de la carretera se suaviza, los reflejos en los vehículos se ven más pronunciados y las colinas circundantes en varios clips se ven más exuberantes y llenas de vegetación. Lo que es aún más impresionante es que los investigadores piensan que, con el hardware adecuado y una mayor optimización, la imagen del juego podría mejorarse mediante su red convolucional a “velocidades interactivas”, en tiempo real, cuando se integra en la representación de un motor de videojuego.
Así que, en lugar de necesitar una PS6 de $2000 para que los juegos se vean así, todo lo que podrías necesitar es una actualización de software.