Os explicamos, para torpes, la arquitectura de la Nintendo Switch 2

Hemos decidido escribir un artículo acerca de la arquitectura de Nintendo Switch 2, ignorando por el camino otras polémicas relacionadas con la consola. Para ello, hemos aplicado nuestro conocimiento a lo que se sabe de la consola, lo que nos ha llevado de paso a descartar ciertos mantras que se llevan repitiendo desde hace ya tiempo en los mal llamados medios especializados respecto a la nueva consola de Nintendo. Por otro lado, pedimos perdón de antemano a nuestros lectores por el parón temporal que hemos tenido.

Dado que carecemos de toda la información sobre la consola por el momento, esta entrada tendrá varias actualizaciones con el tiempo. Por otro lado, este artículo es complementario al que hicimos con la información oficial de Nintendo Switch 2 en su presentación.

La arquitectura de Nintendo Switch 2

Poco sabemos de las entrañas de la consola, desde el lanzamiento de Wii todas las consolas de Nintendo no han tenido especificaciones técnicas completas por parte de la compañía y estas se han sabido a partir de informaciones de terceros. Por lo que una vez más nos encontramos con que hemos de ir componiendo un puzzle para tener una visión completa de la arquitectura de Nintendo Switch 2, el cual de entrada es bastante disperso.

Posible placa base Switch 2 Frontal

Lo primero que vemos es que el chip central de la consola, el cual, tomando como referencia los chips de memoria que lo acompañan, 196 mm² cada uno, lo que tenemos es un chip de 208 mm² presidiendo al sistema. Este es un tamaño muy superior al chip de la primera consola, el Tegra X1, el cual es de 120 mm². ¿A qué se debe que el chip sea tan grande? Nintendo y NVIDIA utilizan para su fabricación el nodo de 8 nm de Samsung y, antes de que la gente se ponga las manos sobre la cabeza, dejad que os lo expliquemos.

En cuanto al hardware, dado que no podemos contrastar, por el momento, con ninguna fuente venida de la propia Nintendo solo podemos confirmar que la consola tiene 256 GB de memoria NVMe para el almacenamiento interno, un slot para tarjetas SD Express y 12 GB de memoria LPDDR5-7500 como memoria RAM conectados a un bus de 128 bits, lo que le da un ancho de banda de 120 GB/s.

8 nm no significa un chip desfasado

El problema actual es que, al contrario de lo que ocurría hace unos años, hoy en día cada nodo de fabricación supone un aumento del coste por área. Es decir, podemos obtener chips más pequeños, de menor consumo y más compactos, pero a un precio mucho más alto. Por si fuera poco, dichos nodos se encuentran saturados, por lo que Nintendo ha preferido optar por uno ya antiguo, pero suficientemente bueno para el chip de la consola, que además le permite tener un gran suministro del mismo, lo que evita problemas de stock y de logística.

Oblea fabricación Chips

La única consecuencia negativa de todo esto ha sido terminar con un chip de gran tamaño, lo que en parte ha llevado a que el diseño de la consola utilice una pantalla de 7.9 pulgadas y les ha forzado a hacer una consola mucho más grande que la Switch original de 2017. Un modelo futuro, fabricado con un nodo más avanzado, va a requerir un rediseño del chip, ya que las normas de diseño de cada fundición y para cada nodo son diferentes. En todo caso, no os extrañe ver un salto como el que hubo de la Switch de 2017, que utiliza el Tegra X1 «Erista» a 20 nm con transistores Bulk, al que hubo con el modelo de 2019 que usa el Tegra X1 «Mariko» fabricado a 16 nm FinFET.

Claro está, que el otro tema es la batería, para nosotros es mucho mejor esperar a ese modelo con un chip de menos nanómetros, memoria LPDDR5X y pantalla OLED, tres elementos que de forma combinada terminarán por traer un sistema que si bien tendrá la misma arquitectura como Switch 2, será energéticamente mucho más eficiente y probablemente mucho más compacta que el modelo original.

Las especificaciones técnicas de Nintendo Switch 2

La información más antigua acerca de la consola de Nintendo es el chip a medida que NVIDIA ha diseñado para Switch 2, del cual pudimos saber información gracias al ataque de unos hackers en marzo de 2021, fecha en la que se filtró información parcial de la consola. En ella se confirmó el uso de una CPU de 8 núcleos ARM Cortex-A78, de velocidad desconocida, y una GPU basada en la serie RTX 30 de NVIDIA, compuesta de 12 núcleos. Ahora bien, hay que ir con pies de plomo cuando hablamos de los de Kyoto.

Chip genérico NVIDIA

Y es que uno de los problemas que tiene Nintendo desde hace varias generaciones es de las frecuencias relativamente bajas en cuanto a sus consolas, se refiere respecto a las capacidades reales del hardware que implementan.  Por ejemplo, con Nintendo Switch pasó algo similar, donde el Tegra X1 funciona a una frecuencia mucho más baja que la NVIDIA Shield, de nuevo limitada por la reducida capacidad de refrigeración del sistema. Y es que no hemos de olvidar que la consola híbrida de Nintendo no es más que una consola portátil con una salida de vídeo externa y lo mismo se aplica a su sucesora, la Nintendo Switch 2.

Si bien desconocemos oficialmente cuáles son estas, y a la espera de que existan filtraciones provenientes del kit de desarrollo oficial, nos vamos a basar en lo que dice NVIDIA en su blog.

Con un rendimiento gráfico 10 veces superior al de Nintendo Switch, Nintendo Switch 2 ofrece una jugabilidad más fluida y gráficos más nítidos.

Obviamente, esto se refiere única y llanamente a la GPU dentro del chip central en la arquitectura de Switch 2. No obstante, tomando solo este componente, esto tiene más miga de lo que parece.

¿Cuál es la potencia real de su GPU?

La primera Nintendo Switch tiene 256 ALU para cálculos de coma flotante de 32 bits, en cambio, la nueva consola tiene 1536 unidades de ese tipo, pero con una trampa, la mitad de ellas se encuentran conmutadas con la unidad de enteros, por lo que si bien el máximo es un x10 en lo que a potencia de cálculo se refiere, podemos decir que fluctúa entre un x5 y un x10. Por otro lado, el ancho de banda que tiene con su memoria es el cuello de botella de toda GPU, por lo que podemos deducir que si bien la consola tiene una potencia de cálculo diez veces superior, elementos como su ancho de banda y las tasas de rendimiento de sus unidades de función fija la colocan en un x5 más bien.

Donkey Kong Bananza

Todo ello sin contar las novedades en la arquitectura, como puede ser el Variable Rate Shading, el uso de Mesh Shaders, la existencia de los Tensor Cores y los RT Cores. Simple y llanamente, tomando en cuenta los elementos comunes de una generación a otra, el salto es un claro x5 sin tener en cuenta las optimizaciones. Para que lo entendáis mejor, en bruto y sin adaptar el código, un juego de Nintendo Switch que en modo portátil funcione a 720p y 30 FPS, lo hará a 1080p y 60 FPS bajo la arquitectura de Switch 2. Claro está que esto es sin tener en cuenta a la nueva CPU, la cual debería recortar considerablemente su tiempo asignado a cada frame.

No obstante, la ventaja aquí es la capacidad de poder renderizar a menos resolución para aplicar el DLSS, lo cual es un arma de doble filo. A bajas resoluciones y con una menor cantidad de información gráfica, el acabado final no es tan preciso como en resoluciones más altas. No obstante, estamos ante la paradoja de Nintendo, donde la consola es suficientemente buena para Nintendo, pero, ¿lo será para las demás?

¿Inferior o superior a una PlayStation 4?

Si miramos las cifras en bruto y comparamos  la consola con PlayStation 4 nos encontramos con que el sistema de Sony tiene mayores tasas de relleno y texturizado que la consola de Nintendo. Ahora bien, en este caso Nintendo consigue solucionarlo con el Tile Caching propio de las GPU de NVIDIA. Si bien no es un Tile Renderer completo, sí que renderiza el frame en pequeños bloques o tiles que en este caso caben en la caché, lo que le permite a la consola resolver gráficamente sin tener que depender del ancho de banda de la memoria principal.

AMBA 5 Chi

Por lo que la comparación con la anterior generación es que la consola de Nintendo, solo por esa característica, sale ganando, ya que fue clave para que las GTX 90 y GTX 10 de NVIDIA posteriormente limpiaran el piso frente a las Radeon basadas en GCN con mucho más núcleos y frecuencia. Si bien el Tile Caching ya se encontraba en la primera Nintendo Switch, el hecho de dar un salto de 256 KB de caché L2 para la GPU a 4 MB supone un aumento en la eficiencia de esta característica. Claro está que estamos obviando por completo la influencia del uso de los Tensor Cores y el DLSS como factores clave, pero ya nos encargaremos después de enfriar las expectativas.

Aquí la clave se encuentra en la CPU de la nueva consola. El Cortex A78 es mucho más rápido y eficiente que el AMD Jaguar de la anterior generación de consolas de sobremesa y para colmo. La arquitectura de Switch 2 viene equipada con 8 núcleos. Si bien no llegan al nivel de Zen 2, resultan otra ventaja considerable a la hora de portar títulos de la anterior generación de sobremesa a la nueva consola de Nintendo.

El mito del T239

Una de las cosas que más nos chirría es ver a los diferentes medios llamar T239 al chip central de la arquitectura de Nintendo Switch 2. Especialmente por el hecho de que se trata de un modelo a medida para una consola de videojuegos y carece de la mayoría de los elementos típicos de un chip para automoción. Hemos de partir del hecho de que la situación con la nueva consola es totalmente distinta a la que hubo en 2015-2016, donde el enorme fiasco de Wii U llevó a Nintendo a no poder permitirse un chip a medida.

Kopite7Kimi T239 Switch 2 Tweet

¿De dónde viene entonces el mito? Pues de un filtrador de NVIDIA llamado Kopite7Kimi quien llamó T239 al chip, pero hay elementos que lo separan por completo de los NVIDIA Tegra de automoción, ya que una consola de videojuegos no los necesita y no son más que espacio utilizado en el chip.

Elemento / MóduloFunción originalRazón para descartar
NVLinkInterconexión de alta velocidad entre chips / GPUsNo se usa en Nintendo Switch 2
DLA (Deep Learning Accelerator)Aceleración de inferencias de IA (visión, voz, etc.)Prescindible si no hay IA intensiva o procesamiento local de redes neuronales
PVA (Programmable Vision Accelerator)Visión por computadora (detección de objetos, SLAM)Innecesario si no se hace AR/VR o tracking avanzado
Safety Cluster / ASIL-D featuresSeguridad funcional para automociónNo aplican en entorno de videojuegos
Soporte para múltiples cámaras (hasta 16 CSI)Interfaz para cámaras simultáneasExcesivo para una consola, que normalmente usa 0 o 1 cámara
Buses automotrices (CAN, LIN, FlexRay)Comunicación entre ECUs en vehículosTotalmente irrelevante para una consola
I2C / SPI múltiples líneasControl de sensores y periféricos embebidosNo se usan en Switch 2
GPIO extensivosControl de hardware externoNo se usan en Switch 2
Pines para CAN/FlexRay (si expuestos)Comunicación en vehículos (ECUs)Totalmente irrelevantes para una consola

Incluso si Nintendo usara el Tegra Orin NX,  el modelo menos equipado, incluso nos encontraríamos con elementos que no se utilizan en una consola de videojuegos. En un mundo donde cada mm² de un chip es valioso por el hecho de que cada vez es más caro, ninguna empresa dejará que se añadan elementos que no tienen utilidad alguna en su producto. Por lo que decir que la arquitectura de Nintendo Switch 2 se basa en un chip de automoción es una falsedad.

¿Otra diferencia? El añadido de RT Cores, los cuales son inéditos en los Tegra Ampere, pero sí que se encuentran en las NVIDIA RTX 30.

Potencia bruta versus inteligencia

Una de las novedades de la GPU en la arquitectura de Nintendo Switch 2 es la llamada Variable Rate Shading. Esta consiste en aplicar el mismo shader a un grupo de píxeles cuando no se necesita recalcular individualmente cada uno. Esto es algo que en juegos de estética Cartoon es ideal y termina siendo una menor carga para los Pixel/Fragment Shaders y con ello un consumo mucho menor de la memoria y el ancho de banda.

Mario Kart World Switch 2

Para que lo entendáis mejor, si se aplica el VRS,  un bloque de 2×2 píxeles con un color similar (rojo, verde, azul) podría someterse a una sola ejecución del shader, lo que hace que no haya necesidad de aplicar sombreado a cada uno de esos píxeles de forma independiente. Sin embargo, para la primera hornada de juegos, especialmente para Breath of the Wild y Tears of the Kingdom, Nintendo ha decidido tirar más por la fuerza bruta, aplicando un salto de x5 (De 1600 x 900 a 30 FPS a 2560 x 1440 a 60 FPS). Esto es lo que le permite tener el ancho de banda de la RAM del sistema, así como las unidades de función fija.

Por lo que el VRS no aumenta la potencia de la consola, ni es ideal para todos los estilos de juego, pero para los utilizados habitualmente por Nintendo sí, y es un enorme ahorro en recursos en los estilos gráficos utilizados habitualmente por los de Kyoto en sus juegos. Claro está que en los primeros juegos con edición «Nintendo Switch 2» ellos han preferido tirar de fuerza bruta y texturas a más resolución.

¿Para qué los RT Cores?

En la arquitectura de Nintendo Switch 2, los de Kyoto podrían haber prescindido de los RT Cores, no parece que la consola tenga la potencia suficiente como para poder ejecutar con soltura escenas 3D con trazado de rayos a tiempo real, viendo los problemas de un hardware más potente. No obstante, eso es ser corto de miras y pensar que dichas unidades solo tienen utilidad en dicho campo. En realidad, tanto Nintendo como NVIDIA han mejorado enormemente el sistema de audio en la nueva consola.

Ray Tracing Audio

Hemos de partir del hecho de que el Ray Tracing no solo se aplica a la luz, sino que también se puede adaptar para simular el comportamiento del sonido en un entorno tridimensional. Al igual que en los gráficos, los RT Cores pueden ser aprovechados para realizar cálculos de reverberación, eco o difracción de sonido en entornos virtuales 3D. Y es que una de las novedades en la arquitectura de Nintendo Switch 2 es el sonido basado en objetos

Sonido basado en objetos

El sonido basado en objetos es un enfoque que trata los sonidos como objetos independientes en un espacio tridimensional, permitiendo que cada sonido se ubique y se mueva en el espacio con sus propias características (como la posición, la dirección, y los efectos acústicos). Los sonidos ya no son solo canales o pistas fijas (como en sistemas estéreos o de múltiples canales), sino que se tratan como «objetos» que pueden ser manipulados y posicionados en el entorno 3D.

Metroid Prime 4 Switch 2

Esto es 100% combinable con el Ray Tracing, ya que cuando un objeto en la escena emite sonido, el trazado de rayos para audio sirve para simular cómo el sonido se refleja, se absorbe o se difunde al interactuar con las superficies del entorno. Con el sonido basado en objetos, cada sonido se trata como un objeto independiente, y su propagación puede ser calculada con precisión para garantizar que el sonido interactúe con la escena de manera realista.

Dicho de otra forma, si se combinan el trazado de rayos y el audio basado en objetos, entonces el resultado en la experiencia sonora termina mejorando respecto a lo ya existente. Nintendo no ha hablado de ello por el hecho de que aún no lo usa en su consola, pero se trata de uno de los cambios más importantes dentro del sistema.

¿Cómo de potente es la arquitectura de Nintendo Switch 2?

Si bien NVIDIA ha hablado de una potencia diez veces superior respecto a la Nintendo Switch original, esto es hacer trampas, más que nada por el hecho que se refiere al total de TFLOPS máximos en FP32 que puede calcular. Lo cual en todas las GPU se da calculando recursivamente la instrucción FMADD que consiste en 2 operaciones por ciclo de reloj. ¿El truco? Pues que esta se realiza en los registros, por lo que apenas hay consumo energético y no se ve limitada por el ancho de banda o la latencia.

En realidad son las unidades de función fija de la GPU, así como el ancho de banda de esta con la RAM que tiene asignada, lo que es su verdadero cuello de botella para una GPU y por los datos que tenemos, el salto no es de x10 como dice NVIDIA, sino más de bien x5 a lo mucho. No olvidemos que con las RTX 30 hicieron la trampa de duplicar las unidades FP32 sin tocar el resto de la GPU, por lo que hay un desfase entre la potencia de cálculo bruta y la evolución del resto del sistema.

De ahí a que vayamos a ver saltos sin optimizaciones que consisten en un salto de 2.5 veces la resolución y el doble de la tasa de frames o 4 veces la resolución sin tocar los FPS máximos. Ahora bien, aún nos queda el DLSS verdad, ¿verdad?

Desmitificando el DLSS en Nintendo Switch 2

Cada consola de videojuegos suele tener un componente o una tecnologia cuyo máximo valor es el paliar las carencias de toda la arquitectura entera. De un tiempo a esta parte hemos visto cómo la arquitectura para Nintendo Switch 2 se considera adecuada para 4K. ¿El motivo? Su capacidad en TFLOPS es cercana a la de PS4 Pro y a la de Xbox Series S. No obstante, esto lo dicen mientras ignoran las tasas de relleno, texturizado y de ancho de banda en la consola de Nintendo, muy inferiores a esos dos sistemas.

Tabla DLSS

Es en ese punto, donde aparece el DLSS, una técnica de Deep Learning que consiste en tomar un frame ya generado y crear uno idéntico a más resolución y en pocos milisegundos. La idea no es otra que la de conseguir un frame a la resolución objetiva en menos tiempo que lo que se tardaría usando fuerza bruta. No obstante, el rendimiento no es siempre el mismo para esta técnica y depende de la potencia de la GPU. Es decir, cuanto más potente menor tiempo requerirá para ejecutarlo.

Cyberpunk 2077

Muy pocos, repetimos, muy pocos juegos funcionarán a 4K. Y sí, sabemos que se trata de un caso extremo, pero Cyberpunk 2077 en Switch 2 funciona a 1080p y 30 FPS en modo calidad, incluso utilizando el DLSS por el hecho de que la máquina no da para más. Eso sí hablamos de uno de los títulos más exigentes para un hardware al nivel de los de la octava generación.

Mejora de resolución para texturas

Una textura al fin y el cabo no es más que una imagen y lo que hacen las técnicas de superresolución es generar una imagen a mayor calidad. Esto significa que dicha técnica puede usarse offline para mejorar las texturas de los juegos ya existentes. No se trata de algo único del hardware de Nintendo Switch y más bien utiliza la versión más primitiva del algoritmo que fue patentado por NERD (Nintendo Europe Research Association) y que muchos han confundido con un tipo de DLSS.

Swirch 2 GameCube

Si bien dicha técnica es similar el concepto, al contrario que la de NVIDIA no usa información de los frames anteriores, por lo que si bien nació como una técnica de aumento de resolución automático se ha quedado como una herramienta interna para mejorar las texturas en los juegos, sean los ya existentes o los que se encuentren en desarrollo. Obviamente, esto no se hace durante el juego, sino que es creado offline por el propio desarrollador y distribuido como parte del parche de expansión.

¿Por qué lo destacamos? Dado que NERD son los encargados de desarrollar los emuladores para sistemas antiguos de Nintendo y la mala calidad, para tiempos actuales, de las texturas de GameCube, creemos que lo han usado para poder reproducir los juegos de la consola a 960p con texturas decentes y sin problemas de dithering del sistema original.

Optimizaciones en la GPU para GameShare

Una de las funcionalidades en la arquitectura de Nintendo Switch 2 es el llamado GameShare donde como si fuese un Cloud Gaming, pero funcionando en una red WAN una consola renderiza el punto de vista de cuatro jugadores distintos en una sola escena. El suyo propio y el de las otras tres consolas. Si ya os comentamos que una de las ventajas es no depender del router para ello, hoy os contaremos la otra mitad de la «magia».

GameShare Local Gaming

Lo habitual en las GPU es que estas tengan un solo procesador de comandos para gráficos, por lo que solo pueden renderizar una escena. Pues bien, la trampa es que el sistema puede manejar 4 listas de pantalla al mismo tiempo. ¿Qué significa esto? Pues que divide entre 4 los recursos de la GPU, por lo que los títulos que usen el GameShare se van a ver limitados visual y técnicamente a un nivel similar a los de la primera Nintendo Switch. Esto requiere cambios profundos en la GPU y se trata de otro de los clavos en el ataúd respecto al concepto de que Switch 2 utiliza un chip castrado para el mundo de la automoción, como han dicho algunos desinformadores por ahí. Aunque no creemos que lo hagan de mala fe, sino más bien por ignorancia.

5 4 votes
Article Rating
Subscribe
Notify of
guest

1 Comment
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Cormac
Cormac
4 days ago

La consola parece bastante apañada a nivel de hardware, al menos considerando que es principalmente una portátil. Pero la política de precios adoptada es atroz: lo mínimo era que las mejoras visuales y de rendimiento de los juegos de la anterior consola fuesen una actualización gratuita en el nuevo hardware pero ni eso dan a los fans que ya pagaron por ellos. La subida a 90€ por un juego en formato físico es absolutamente brutal para el usuario.

1
0
Would love your thoughts, please comment.x
()
x