Jarro de agua fría con AMD Magnus, ¿se deshincha la próxima Xbox?

Las nuevas informaciones sobre AMD Magnus han enfriado los ánimos respecto a lo que podría ser el microprocesador central o SoC de la consola de próxima generación de Microsoft. Este artículo lo escribimos como una fe de erratas del primer artículo, ya que con la nueva información las cosas han hecho un giro de 180º, es por ello que nos vemos en la obligación de escribir este segundo artículo. De paso os recordamos que las partes no tachadas del primer artículo siguen siendo válidas, por lo que la información respecto al SoC Die es por el momento, correcta. Además, en esta entrada haremos también un poco de especulación sobre el chip principal de la siguiente Xbox.

Bus de 192 bits para AMD Magnus

Tom, en su canal Moore’s Law is Dead ha filtrado nueva información de Magnus, dónde él mismo corrige una mala interpretación por su parte que tiene que ver con el ancho de banda del bus de datos entre el GPU Die y la memoria, dónde se dijo que era de 384 bits (12 x 32 bits)  resulta que es de 192 bits (12 x 16 bits). La explicación de esto seguramente sea que el controlador de memoria solo puede manejar un flujo de datos concreto y no olvidemos que la GDDR7 otorga un ancho de banda mucho más alto por pin de transferencia.

Magnus 192 bits specs

¿La contraparte de ello? Hablamos que hemos pasado de 12 chips de memoria a 6 chips de memoria. En todo caso dado que las GPU están equilibradas según el ancho de banda y la GDDR7 duplica a la GDDR6, esto permite tener una configuración con una mayor cantidad de núcleos. A día de hoy en lo que a tecnología se refiere, poco se puede hacer ya para mejorar en la rasterización, solo colocar más y más núcleos. El problema es que el ancho de banda depende de la interfaz de memoria que se encuentra en la periferia del chip, cuantos más bits más área necesita el chip, independientemente del ancho de banda.

Por otro lado, el hecho de bajar el bus a la mitad, supone que la cantidad de chips de memoria que se pueden conectar baja a la mitad, teniendo en cuenta que hasta el momento el tamaño de cada chip es de 3 GB, esto significa que la siguiente Xbox equipada con Magnus vendría equipada con solo de 18 GB de memoria RAM, pero miramos la tabla que ha publicado MLID en su último vídeo se puede deducir que veremos chips de memoria GDDR7 con 4 GB de capacidad, pero parece que estas irán principalmente al mercado de la IA/Machine Learning. Aunque Microsoft podría usarlo en su consola para poder alcanzar los 24 GB, si no contamos de que usen uno de los chips en modo Clamshell.

RDNA 5 MLID

La otra información que ha dado es que tanto el SoC Die como la GPU Die se fabricaran bajo el mismo nodo de 3 nm, lo que significa que el proveedor podría volver a ser TSMC y que todo el circuito integrado se fabricaría en un mismo lugar, en vez de hacerlo en varios sitios para unirlo después. Todo esto tiene sentido en una consola que es totalmente sensible al coste de sus componentes.

¿Cuanta memoria RAM irá a la CPU?

Ahora bien, en la entrada anterior os comentamos que uno de los argumentos para tener un bus de 384 bits era el hecho de poder instalar en el sistema hasta 48 GB y os dimos una explicación muy simple: «esto permitiría ejecutar los juegos de PC y sus ingentes requisitos en RAM» sin problemas. Obviamente con una configuración de 18 a 24 GB dicha explicación se va al traste a no ser que Microsoft decida tirar de una configuración tipo clamshell. ¿Qué significa esto? Pues colocar dos chips de memoria compartiendo el mismo bus de datos, de tal manera que se duplica la capacidad de almacenamiento, pero no el ancho de banda.

GDDR7 GPU

No obstante, no creemos que todas las interfaces de memoria tengan dos chips de memoria, sino solamente dos de ellos. Por lo que la configuración que nosotros esperamos ver es una configuración de 32 GB. Claro está que al igual que ocurre en las actuales Xbox Series, que una parte del direccionamiento es de acceso exclusivo para la CPU y una parte para la GPU, de ahí a que funcionen con anchos de banda diferentes. En todo caso, con Zen 6 hay cosas que van a cambiar por completo y esto ya no forma parte de la filtración de MLID, sino más bien a otros rumores. No hay ninguna duda de que en un futuro veremos ordenadores que usen memoria LPDDR6 bajo un bus de 192 bits como RAM para para el sistema en los PC, y sí, sabemos que esto será una consola con memoria unificada, pero la clave aquí esta en como se conecta la CPU con la memoria.

CAMM2 LPDDR6

El rumor es que Zen 6 va a usar un doble controlador de memoria funcionando en paralelo, hasta el momento el controlador de memoria de los Zen funciona a la memclk de la memoria con un bus de 256 bits. Partiendo que las memorias del tipo DDR tienen un ancho de banda por fin que es el doble de su memclk esto significa que se diseñaron para los módulos DIMM estándar que son de 128 bits (64 bits por canal). A lo que nos referimos es que la CPU se comunicará con un bus de 384 bits a la memclk. Ahora bien, sabemos por la info que ha filtrado MLID la velocidad de la GDDR7 que usara AMD Magnus, 36 Gbps, pero en modo PAM3, lo que se traduce en que transmite 3 bits cada 2 pulsos de reloj en vez del habitual de 2 bit por pulso.

NRZ Mode

Esto significa que la GDDR7 no tiene unas velocidades de reloj tan altas como la GDDR6, lo cual es clave para no sobrecalentar la memoria, y a 36 Gbps en realidad hablamos de 24 Gbps en modo PAM3 para el bus de datos, 6 GHz para el Work Clock y 1.5 GHz para el memclk. Esto es una velocidad de reloj mucho más baja que los 1.75 GHz de la GDDR6 en los modelos estándar de PS5 y Xbox Series, pero dado que hablamos de un bus de 384 bits y no de 256, esto serían 72 GB/s de ancho de banda para la CPU y sus clientes.

Ahora bien, el funcionamiento del modo NRZ es diferente al modo PAM3, si bien la WCK cuadriplica a la memclk, la cantidad de Gbps que deriva del WCK no es cuatro veces, sino dos veces, lo que hace que en modo NRZ cada pin tenga un ancho de banda de 12 Gbps. Haciendo números, si todas las interfaces están en modo PAM 3:

  • 864 GB/s de ancho de banda para las 6 interfaces GPU-GDDR7.
  • 144 GB/s por interfaz de 4 canales
  • 36 GB/s por canal GDDR7 en PAM3.

Sin embargo, en modo NRZ:

  • 288 GB/s de ancho de banda para las 6 interfaces
  • 48 GB/s por interfaz de 4 canales.
  • 12 GB/s por canal GDDR7 en NRZ.

GDDR7 4 Channels

La diferencia respecto a las Xbox Series, es que en el caso que nos ocupa lo que tendremos serán 6 canales de memoria asignados a la CPU, esto se traduce que los primeros 4 GB irán en exclusiva a la CPU donde se le asignarán 4 canales de memoria. Sin embargo, 4 GB es una asignación menor que la que existe en Xbox Series X que es de 6 GB, de ahí a que pensamos que la interfaz tendrá 2 chips en modo clamshell para tener 8 GB asignados para la CPU.

La segunda interfaz y la descompresión avanzada para el SSD

Nosotros creemos que la segunda interfaz de memoria tendrá la zona de la RAM que será un poco la zona neutral, ya que dará acceso tanto el SoC Die como al GPU Die, pero sobretodo se usará para que la NPU y los descompresores de datos y los DSP de audio puedan realizar su trabajo y asistir tanto a la CPU como a la GPU. La clave de este espacio de memoria es que terminará con el problema de tener que copiar datos de un espacio a otro, ya que se tratará de una zona mixta donde ambos chips y sus clientes tendrán acceso y es por lo tanto, la zona ideal para que la información se pueda descomprimir desde el SSD.

SSD Xbox

Para que entendáis mucho mejor el propósito de nuestra idea, y esperamos que Sony y Microsoft la adapten, es que en vez de que los datos del SSD se descompriman en el espacio de memoria de la CPU y la GPU, darle su propio espacio en la RAM para realizar esta tarea y que se copien los datos al direccionamiento correspondiente una vez se ha hecho el proceso de descompresión. En resumidas cuentas, el procesos sería el siguiente:

  1. El SSD copia los datos comprimidos directamente en la memoria compartida que se encuentra conectada a la interfaz 2.
  2. Los ASIC para descompresión y la NPU realizan el trabajo de la descompresión de los datos en la memoria que se encuentra en la interfaz 2.
  3. Una vez descomprimidos, los datos se copian a la RAM de la CPU o GPU cuando los canales de acceso a la interfaz 2 están libres.

¿Y que ventajas tendría esto respecto a la actual generación? Si bien en las consolas actuales tenemos ASIC de descompresión de datos dedicados, estos aún utilizan el bus de datos con la CPU y la GPU, provocando contenciones y atascos de memoria. Nuestra idea de cara a la siguiente generación va mucho más allá, ya que esta esta arquitectura propone un aislamiento completo del flujo de descompresión.

  1. Los datos comprimidos fluyen desde el SSD a una interfaz de memoria dedicada (24 GB/s), donde los ASICs y una NPU los procesan directamente en la RAM.
  2. Una vez descomprimidos, se transfieren a la CPU o GPU sólo cuando sus canales de memoria (72 GB/s en el caso de la GPU) están libres.
  3. Esto evita cualquier contención durante el juego y permite un streaming continuo de datos sin sacrificar recursos de ejecución o renderizado.

gta vi trailer

Al aislar completamente el proceso de descompresión en canales de memoria dedicados, esta arquitectura permite que los datos fluyan desde el SSD a la RAM y se preparen para la CPU o GPU sin interferencias en el funcionamiento de estas. Esto reduce el riesgo de microtirones, el horrible popping de texturas y a veces la caida de FPS cuando el jugador cambia el ángulo de la cámara. No obstante, hay otro elemento que creemos que será clave, en especial para una consola como la siguiente Xbox donde podrán ejecutar juegos de PC.

Compilación de shaders al vuelo

La gran diferencia entre el PC y las consolas es que los shaders en el primer caso se compilan al vuelo, provocando enormes problemas de rendimiento en los juegos para ordenador, mientras que en consola ya vienen comprimidos. Nuestra segunda idea es que en la misma interfaz de memoria donde se realiza la descompresión de datos desde el SSD también se compilen los shaders sin participación en ello de la CPU o la GPU.

Pues bien, parece ser que las CPU Zen 6 soportarán hasta 12 núcleos, pero en la configuración del AMD Magnus tenemos 11 núcleos. ¿Dónde se encuentra el decimosegundo? Nuestra idea es que se encargue exclusivamente de compilar los shaders al vuelo. No cuando son necesarios, sino de forma preventiva para evitar problemas de rendimiento. Este núcleo no es accesible para la ejecución general del juego ni otras tareas del sistema, sino que está reservado para:

  • Coordinar la recepción de datos comprimidos y su almacenamiento en la memoria dedicada de alta velocidad.
  • Supervisar y orquestar la descompresión de datos mediante ASICs especializados y la compilación simultánea de shaders por la NPU integrada.
  • Controlar la transferencia de los datos descomprimidos y los shaders ya compilados hacia las áreas de memoria asignadas a la CPU principal y la GPU, asegurando que esta operación solo se realice cuando los canales de memoria estén disponibles para evitar interferencias.
  • Gestionar las colas de procesamiento y la sincronización de estos flujos para mantener un pipeline eficiente y continuo, minimizando cualquier posible latencia o bloqueo.

Avowed Geometria masiva UE5 Nanite

Ahora bien, sabemos que lo que os interesa son los beneficios directos en los juegos. Lo bueno de esto es que los shaders llegarán  ya compilados y optimizados justo a tiempo cuando los modelos/texturas se transfieren al espacio de memoria de la GPU. Todo ello sin que los otros núcleos de la CPU tengan que gestionar la compilación de shaders y tampoco la GPU. Es decir, la compilación se coordina con la descompresión, asegurando que el pipeline gráfico no tenga cuellos de botella. Lo cual es ideal para juegos con miles de shaders distintos o sistemas basados en materiales complejos.

Las especificaciones de la GPU Die

Si hacemos caso de lo que dice MLID, bajo la arquitectura RDNA 5/UDNA se fabricarán dos chips distintos, cada uno de ellos de diferentes configuraciones, de cara a la siguiente generación de tarjetas gráficas para PC las configuraciones parece ser que serán las siguientes.

RDNA 5 PC GPU Specs

Por lo que el GPU Die usaría el AT2 de la RX 10070 XT, la cual parece ser que tendrá un 20% más de potencia. Sin embargo, no nos adelantemos, ya que por la informaciones que se han filtrado la cantidad de núcleos en el chip AT2 sería de 72 en una configuración de 2 Shader Engines, 2 Shader Arrays por Shader Engine y 18 WGP/36 núcleos por Shader Array. Es decir, de 72 Compute Units. Desconocemos la configuración que llevará Magnus en la siguiente Xbox y solo tenemos que esperar a tener los datos definitivos.

5 3 votes
Article Rating
Subscribe
Notify of
guest

1 Comment
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
JMonster
JMonster
17 days ago

Pues si, un poco de decepción y jarra de agua fría a lo que se especulaba desde un principio, pero aquí te lanzo mi duda que a la vez es opinión.
La versión que mencionas de chip de 64 CU que equivaldría a una posible 1070xt seria para el modelo de consola no? ósea que se estima que eso es lo que llevaría la Series x 2 cierto??

Lo digo por si todavía hubiera posibilidad de haber una versión mejorada o premium en la ecuación para que se venda a la par de series x 2 pero que esta vez no lo venda Microsoft, y sea terceras compañías las encargadas de la versión Pro de lanzamiento, me explico mejor y doy ejemplos

Microsoft y para no mentir en lo que dijo Phil Spenser de que «no querían consolas a 1000 Dolares »

Podrían repetir el modelo Series S y X en esta nueva generación, pero esta vez la Series S equivalente seria mas potente y obviamente mas cara, lanzar la consola base a 550 o 599$ que seria la Series X 2 con los 64CU con su Ram correspondiente para aguantar la generación y no ser tan hándicap como ha sido o esta siendo la Series S actual para muchos desarrolladores, y proponer para las terceras compañías a precios obvios mas altos, tipo 799$ 899$ o 999$ la versión con 80CU lanzada por Asus, MSI o Lenovo.

Una básica y estándar de Microsoft con 4K y su FSR4 nativo gracias al RNDA5 o UDNA que a saber si también puede meter frame generation en ella, para seguir con el eslogan y algo mas real por fin del 4k o 120fps y la versión Premiun de 80CU mas cara para terceros con especificaciones mas altas en los juegos donde si fuera posible el 4K con 120fps y opciones de Raytracing de mas alta calidad.

Por no decir, que a saber si una posible versión de 80CU o cercanas a ellas, aunque entiendo que no mas alto por que ya seria complicado meterlo en una apu, por mucha diferencia que hay de una1070XT de 64CU a 1090XT con 154CU.

Podrían ser las versiones de servidores para Microsoft para el juego en la nube, ya que se especula que están renovando o lo van hacer para tener por fin una retrasmisión mucho mejor y de nueva generación que la que tiene ahora, ya que si es verdad que se puede añadir hasta 4 versiones o categorías nuevas para el game pass o independientes para el xcloud como se esta rumoreando, pues así si podría competir con el servicio que ofrece Geforce Now, el modelo premium con retrasmisión a 4k 120fps y raytracing equivaldría la versión Ultimate que te ofrecen equipos de 16 núcleos y una 4080, ahí si podría ser utilizada la versión de 80CU por que a saber si luego ese servicio se renueva y te ofrecen la 5080 o 6080 de aquí a un año o 2, por lo que lo vería factible, otra versión mas normal podría ser las versiones de Series X 2 con servidores con las 64CU para ser la posible versión estándar, y las demás tiers dependan de los juegos disponibles, o horas de uso ya que se habla de versiones con publicidad, o limite de horas y cosas así, y con esas 2 apus podrían tener otra vez para una buena generación de 5/6 años si no descartamos alguna versión intermedia por tercera con UDNA 2 o 3 si el mercado lo va pidiendo o necesitando.

1
0
Would love your thoughts, please comment.x
()
x