¿Cómo creemos que será la PlayStation 6 en cuanto a hardware?

Después del frío y excesivamente aséptico adelanto de Switch 2 por parte de Nintendo, el próximo objetivo de los medios obviamente es PlayStation 6, y más ahora que PS5 Pro ya se encuentra en el mercado y ya se conocen todos los detalles de su hardware. Si el timing coincide con las dos últimas consolas de videojuegos de Sony, entonces la fecha mínima en la que deberíamos esperar su lanzamiento al mercado es a finales de 2027, fecha que nos parece muy temprana, pero viable. Es por ello que hemos decidido recopilar todos los rumores de PS6 y nuestras especulaciones en un solo lugar

Para este artículo utilizaremos de manera ilustrativa los renders de Behance

¿Qué sabemos seguro de PlayStation 6?

Dos cosas, será mucho más potente que PS5 Pro en todos los aspectos y compatible hacia atrás con el catálogo de juegos de PS4 (Pro) y PS5 (Pro), aunque no es normal que en una consola la compatibilidad hacia atrás se mantenga para dos generaciones, el hecho de que Sony haya adoptado una arquitectura basada en x86 para la CPU y bajo el mismo proveedor, AMD, podría hacer esto posible. Sin embargo, los mayores problemas que tienen que solucionar de cara a PlayStation 6 no tienen nada que ver con la compatibilidad hacia atrás.

Render PS6

Otro de los cambios importantes es el uso de memoria GDDR7 para el sistema, la cual duplica el ancho de banda por pin respecto a la GDDR6. Por el momento solo se vende en chips de 2 GB, pero se sabe que pronto saldrán los de 3 GB. ¿Quién sabe si para PlayStation 6 veremos los de 4 GB haciendo posible una configuración de 32 GB GDDR7 en la próxima consola? En todo caso, la mayor latencia de la GDDR7 plantea cambios en la organización general, sobre todo en lo que a la CPU se refiere, que ya comentaremos más adelante en esta entrada.

La gran incógnita de la consola es el soporte para el formato físico. La PS5 Pro ya requiere la compra de un lector aparte, ya que no viene de serie con la consola, por lo que es lógico pensar que ocurrirá lo mismo en PlayStation 6, consola de la que no creemos que haya lanzamientos en disco óptico, especialmente por el hecho que el Blu-ray ya no da la talla como formato de almacenamiento por sus problemas de acceso y ancho de banda.

¿Qué dicen los rumores de la consola?

Si bien todavía falta un tiempo prudencial para que se filtren las primeras informaciones de la consola, hemos decidido comentar los primeros rumores de PlayStation 6 en lo que al hardware se refiere y analizarlos para ver lo viables que pueden llegar a ser.

Rumores SoC PlayStation 6

De estos rumores lo que nos interesa es a partir de la tercera línea, parece ser que la idea de la V-Cache que usan los AMD Ryzen X3D para aumentar su rendimiento a base de sumar más caché de último nivel a la CPU no solo será llevado a las GPU integradas en la siguiente generación, sino que esta será compartida. ¿Acaso no existe ya la Infinity Cache desde RDNA 2? Pues sí, pero esto es diferente, dado que esta nueva caché es global. Además, dado que Strix Halo separa CPU y GPU en dos chips distintos sobre un interposer, la lógica es que dicha caché 3D, así como los controladores de memoria se encuentren en el Interposer en el que tanto CPU como GPU irán conectadas, el cual se encuentra en la parte inferior de ambos, haciendo que la interconexión con la nueva caché sea en vertical.

Un cambio total de planteamiento

Hemos de aclarar que este no será el chip de PlayStation 6, pero AMD usará un diseño donde separará CPU y GPU en chips distintos, pero dentro de una misma pieza. En todo caso, uno de los mayores cuellos de botella en PS5 y su versión mejorada es la falta de una caché de tercer nivel para el procesador gráfico. Por otro lado, el hecho de tener una caché compartida en común hará que el direccionamiento pueda funcionar de manera totalmente coherente entre la CPU y la GPU, eliminando la necesidad de ir copiando información desde el espacio asignado a la CPU al de la GPU de forma continua.

AMD Ryzen AI Max

El nuevo IOD

En las arquitecturas actuales de AMD, el IOD es la parte responsable de la gestión de las conexiones entre los diferentes componentes, como los núcleos de CPU y la memoria. A se encuentra en un chip aparte si hablamos de los AMD Ryzen de escritorio, el cual se encuentra desglosado en chiplets. En el caso de las APU/SoC para portátiles y consola, actualmente este se encuentra en el mismo chip al ser estos diseños monolíticos.

AMD Instinct MI300 organización

La idea sería mover el IOD a ser un chip por debajo de la CPU y la GPU, pero a diferencia que en las Instinct MI300, el Silicon Interposer en PlayStation 6 sería mucho más pequeño y en un único bloque, dado que no usará memoria HBM, sino GDDR7,  la cual no necesita colocarse en un interposer. Además, que dicha pieza en el monstruo para computación de alto rendimiento de AMD es enorme por el hecho que necesita para comunicar los diferentes IOD entre sí y que estos accedan a la RAM del sistema, situación que no ocurrirá en la consola, donde solo tendremos un IOD.

AMD Instinct MI300

La funcionalidad del IOD es la intercomunicación interna de los diferentes componentes del SoC, así como la comunicación de estos con la RAM del sistema. No solo para la CPU y la GPU, sino también para otros aceleradores y procesadores de apoyo que suelen incluirse como: DSP para la generación de audio, NPU para tareas livianas de Deep Learning, códecs vía hardware de audio y vídeo, controladores de pantalla que envían la información del último frame al búfer de imagen. Sin embargo, en el diseño de PlayStation 6, todos estos componentes pueden ir a parar a un tercer chiplet, dejando el IOD solo para la intercomunicación interna y liberando espacio para lo que se llama la System Caché.

System cache en el IOD

Los rumores hablan de que PlayStation 6 usará la V-Cache tanto para CPU como para GPU. Dicho planteamiento ya lo hemos visto en las AMD Instinct MI300, por lo que AMD ya tiene una experiencia previa en aplicar una solución de este tipo. Ahora bien, es una idea diferente a la Infinity Caché, ya que esta es privada de la GPU y también de la V-Cache, ya que no es solo para la CPU, y además, estamos hablando de un nivel de caché adicional.

El añadir un nivel adicional de caché se puede hacer cuando la latencia de acceso a la memoria RAM es lo suficientemente alta y te da margen para ello. Si bien la GDDR7 entrega un considerable ancho de banda, la latencia ha de ser lo suficientemente alta como para justificar esta System caché, la cual haría de caché de cuarto nivel para la CPU, pero también de tercer nivel para la GPU.

Claro está, que creemos que esta terminará integrada en el IOD, cerca del controlador de memoria del sistema, ya que hablamos de una SRAM de gran tamaño, esta demasiado espacio para colocarse en la CPU o la GPU.  Por otro lado, el hecho de tener una caché de último nivel reduce enormemente no solo la latencia de ciertas operaciones, sino también el consumo energético. Ya que nada consume más que leer o escribir desde una memoria RAM externa. Cada transacción de información que se mantiene en el chip ahorra una enorme cantidad de energía.

Otras funciones del IOD y posibilidad del diseño

El IOD además dispondrá de las interfaces externas que suelen tener la CPU y la GPU por separado, lo cual significa que la memoria RAM del sistema, así como el Southbridge se comunicará directamente con el IOD, eso sin olvidarnos de la salida o salidas de vídeo que vaya a tener la PlayStation 6. Debido a ello, no debemos ver al IOD como una pieza separada a lo que es la CPU y la GPU del sistema, sino que todo ello formaría parte de un todo, con la diferencia de que el chip no sería monolítico, sino compuesto por diferentes componentes.

En todo caso, hemos de aclarar que nos parece un salto en complejidad muy grande. En todo caso, tenéis que entender que la construcción hipotética que estamos haciendo es añadiendo la System Caché en vertical a la ecuación, tal y como dicen los últimos rumores. Aunque en el tiempo de escribir esto se comenta que el diseño del SoC de PlayStation 6 ya se ha terminado, esto no lo confirma como un chip monolítico y tampoco descarta una construcción como la que hablamos.

Más bien, el dilema en Sony estará en tener que sacrificar en otras áreas para mantener el coste del diseño final dentro de unos niveles de coste razonables. El otro problema es que un diseño de este tipo requiere mucho más tiempo y pasos que un diseño convencional monolítico, lo cual podría descartarlo de entrada teniendo en cuenta los volúmenes de venta y distribución de las consolas.

Más núcleos en la CPU… para un Ray Tracing más eficiente

En 2021, la revista WIRED hizo una colaboración con Mark Cerny para explicar cómo se había diseñado PlayStation 5 a partir del feedback de los diferentes desarrolladores y uno de los puntos más interesante fue la revelación de que algunos estudios le pidieron al arquitecto jefe de la consola el incluir una CPU con 16 núcleos en vez de 8. El motivo de no hacerle caso a dicha petición era que al compartir espacio en el mismo chip y tener un presupuesto en transistores limitado, Sony decidió darle preferencia a la GPU, ya que de otra forma el rendimiento gráfico de PlayStation 5 hubiese sido mucho más bajo.

 

Ahora bien, desconocemos cuál será la configuración de núcleos de la CPU PlayStation 6, al mismo tiempo que no sabemos qué generación de los AMD Zen llevará. En todo caso, la ventaja de tener un diseño disgregado es que tanto Sony como AMD pueden escoger un diseño u otro al poder cambiar el CCD por otro si aparece una arquitectura Zen más avanzada durante el desarrollo o más conveniente. ¿El único handicap? Si el diseño es el rumoreado, entonces tendrán que adaptar las interfaces de comunicación con el IOD colocado justo debajo, pero esto es algo que ya se ha hecho con el Instinct MI300.

Por qué 16 núcleos en PlayStation 6 no son una exageración

En nuestra asignación del trabajo de cada núcleo, vamos a reservar dos de ellos: el primero de ellos para gestionar el sistema operativo y el segundo se encargará de crear las listas de comandos para enviar a la GPU y generar el frame siguiente, por lo que nos quedarán 14 núcleos/28 hilos de ejecución en total para lo que necesite la lógica del juego. Pues bien, de todos ellos, asignaremos 11 núcleos a la lógica del juego, aunque dependiendo del videojuego, la asignación será de una manera u otra, dado que no todos tienen las mismas exigencias en las distintas áreas.

FunciónNúcleos/Hilos asignadosDescripción
Sistema operativo1/2Dedicado exclusivamente a las tareas del sistema operativo.
Generación de la lista de comandos para la GPU
1/2Se encarga de la preparación y envío de listas de comandos gráficos y de cómputación
hacía la GPU
Generación del BVH para el Ray Tracing3/6Creación de la estructura de datos (BVH) para el Ray Tracing
Simulación de físicas1/2Simulación de físicas secuenciales, como cuerpos rígidos, objetos conectados por juntas, y físicas que interactúan directamente con la IA o la lógica del juego.
Inteligencia Artificial2/4Procesan comportamiento de NPCs, toma de decisiones y rutas de navegación.
Sistemas de animación1/2Calculan interpolaciones de animaciones, sincronización de esqueletos y blending
Gestión de escenas y lógica de eventos1/2Coordina la carga/descarga de objetos en el mundo, cambios de nivel y activación de eventos en tiempo real.
Sistemas de particulas y efectos especiales1/2Maneja cálculos para sistemas de partículas (como fuego, humo y explosiones). Si bien parte de esta carga puede delegarse a la GPU, la CPU controla el comportamiento lógico de los sistemas..
Gestion de lógica de red (multijugador)1/2Sincroniza datos entre jugadores, maneja paquetes y realiza cálculos relacionados con el estado compartido del juego. Si el juego es offline el núcleo puede reasignarse
Sistemas de scripting y lógica del usuario1/2Procesa scripts personalizados, entradas del jugador y lógica secundaria que interactúa con los sistemas principales.
Cálculos secundarios o dinámicos (como LOD y streaming de datos1/2Ajusta dinámicamente el nivel de detalle (LOD) de los objetos y gestiona la transmisión de datos en grandes mundos abiertos.

De la lista de tareas, lo que seguramente más os sorprenderá es que se le asignen 3 núcleos a la generación del árbol BVH, una tarea que tiene que ver más bien con el trazado de rayos. Sin embargo, en la actualidad esto es uno de los mayores cuellos de botella en el Ray Tracing, y es que las GPU no tienen un diseño optimizado para dicha tarea pese a su enorme potencia de cálculo. Por lo que asignar una serie de núcleos de la CPU central a esta tarea resolvería uno de los mayores problemas que tiene el uso del Ray Tracing en consolas, el cual se da también en el hardware más potente de la actualidad.

Una CPU es mejor que una GPU para generar el árbol BVH

El árbol BVH es una estructura de datos esencial para el Ray Tracing. Su construcción implica organizar las primitivas geométricas (polígonos) que forman parte de una escena dentro de una estructura jerárquica, un proceso que funciona mejor en una CPU que en una GPU. Esto se debe a que los núcleos de una CPU están optimizados para manejar estas tareas secuenciales y dependientes, gracias a sus núcleos potentes y eficientes en operaciones condicionales.

 

Hemos de partir del hecho de que la construcción del árbol BVH es un algoritmo con flujos de control complejos y recursivos, que no se adaptan bien al diseño masivamente paralelo de las GPU. Además, el proceso incluye operaciones como la ordenación de datos y cálculos basados en heurísticas (por ejemplo, el Surface Area Heuristic, SAH), que son difíciles de paralelizar y requieren una mayor potencia por núcleo, algo en lo que los núcleos de la CPU tienen una enorme ventaja sobre los de la GPU.

Otro aspecto crucial es el sistema de cachés y de acceso a la memoria, donde las CPU se benefician de una baja latencia y mecanismos de caché más avanzados. Esto las hace mejores para los accesos irregulares que requiere la construcción de un árbol BVH. Por lo que en conclusión, aunque las GPU pueden acelerar ciertas partes del proceso, la construcción completa del BVH se adapta mejor a la arquitectura de las CPU.

¿Cómo podría ser la GPU de PlayStation 6?

La PlayStation 4 se basó en la arquitectura GCN, PlayStation 5 se basa en la segunda generación de la arquitectura RDNA y en el caso de PlayStation 6, todo apunta a que la elección será UDNA, conocida antes como RDNA 5. El cambio de nombre de la arquitectura por parte de AMD se debe a que unifica en una sola arquitectura los puntos fuertes de CDNA y RDNA. ¿La diferencia entre GCN y RDNA? La forma en la que están organizadas las unidades SIMD y el tiempo en el que resuelven las olas.

GCN vs RDNA

Tanto en RDNA como en GCN/CDNA, los núcleos de la GPU están compuestos por 64 ALU en FP32, en una disposición tipo SIMD, pero con una organización diferente. En el caso de GCN tenemos una configuración de 4 x 16 y en RDNA 2 x 32. A GCN se le asigna una ola de 64 elementos a cada unidad SIMD, por lo que tardará un mínimo de 4 ciclos en resolver toda la ola, mientras que en RDNA las olas pueden ser de 32 componentes, lo que puede hacer que se solucionen en un solo ciclo de reloj o en dos si hablamos de una ola de 64 componentes.

UDNA RDNA Timing

Esto se traduce en una reducción de la cantidad de ciclos de reloj necesarios para resolver una ola, lo que significa que en la misma cantidad de tiempo, el núcleo de una GPU RDNA puede resolver más olas que una GCN. Es por ello que, incluso a igualdad de TFLOPS y núcleos, RDNA es mucho más eficiente y da mejor rendimiento que GCN, pero esta es la arquitectura que utiliza PlayStation 5. Por el momento desconocemos cómo será UDNA en PlayStation 6, pero podemos especular con ello.

Una evolución desde RDNA

En RDNA, dos Compute Units trabajan conjuntamente en forma de WGP (Work Group Processor) dado que comparten elementos entre ambas como es la memoria local compartida, la caché de instrucciones y la caché para las unidades escalares. Desde aquí creemos que UDNA en PlayStation 6 terminará de unificar ambas en una sola unidad, pero dejando a las unidades de función fija aparte.

Compute Unit RDNA 3

Esto hará que cada núcleo de la GPU tenga 128 ALU en FP32, duplicando la capacidad de cómputo. Claro está que aquí el problema es la caché de datos (L0), que se encontraría asociada a las unidades de función fija para Ray Tracing y texturas. Pues bien, dichas unidades no se duplicarían, seguirían la configuración que tienen actualmente por cada núcleo de la GPU. Eso sí, AMD le haría una fusilada enorme a NVIDIA y usaría dos niveles de caché dentro de cada núcleo de la GPU. Por un lado, una caché L0 compartida entre las Matrix Core Units y las unidades SIMD/SIMT, por el otro, una caché L1 de datos compartida que estaría un nivel por debajo y haría el trabajo de la actual L0 en RDNA.

Nuestro objetivo, a la hora de separar las unidades SIMD/SIMT de las de función fija y asignar diferentes niveles de caché (L0 para SIMD/SIMT, L1 para función fija), es mejorar tanto la latencia como la eficiencia del sistema de caché dentro de cada uno de los núcleos de la GPU en PlayStation 6. Por un lado, evita la contención directa entre ambas partes, por el otro, reduce el tiempo por instrucción ejecutada, permitiendo velocidades de reloj mucho más altas.

AMD debería abandonar SIMD y adoptar SIMT

El problema de las unidades SIMD clásicas es que el programador o el compilador han de asegurarse de que el tamaño de las instrucciones vectoriales contengan un volumen de datos a la capacidad exacta de cada una de las unidades SIMD. Por lo que el paralelismo ha de ser regular, pero esto en la vida real no es así y termina ocurriendo que muchas veces las ALU se quedan sin hacer nada.

SIMD versus SIMT

Lo curioso es que NVIDIA hace tiempo que solucionó ese problema utilizando un planteamiento llamado SIMT, el cual no se programa instrucciones vectoriales, sino un planteamiento llamado SPMD. En dicho modelo, en vez de tener una instrucción para múltiples datos, tenemos que cada ALU ejecuta su propio programa (de ahí lo de Single Program), pero cada uno de ellos opera sobre un dato distinto (Multiple Data) por lo que se puede replicar el funcionamiento de una unidad SIMD, pero permite que cada ALU tenga su propio contador de programa y divergir.

¿La ventaja de este planteamiento? Las ALU que en un planteamiento SIMD estarían sin hacer nada pasarían a estar ocupadas, aumentando la eficiencia y el rendimiento. Y no, no se trata de un planteamiento que naciera con las RTX, ya que lleva mucho tiempo en las GPU de NVIDIA y no entendemos por qué AMD sigue con el planteamiento SIMD en sus GPU, bueno sí, que es mucho más barato de implementar. En todo caso, es un problema, ya que incluso la propia AMD recomienda hacer optimizaciones en los juegos para adaptarlos al planteamiento SIMD.

El impacto de la memoria GDDR7 en la GPU

Dado que las GPU requieren un gran ancho de banda para funcionar bien, y en consolas se busca un único pozo de memoria por costes, se sacrifica el rendimiento de la CPU usando la misma memoria que las tarjetas gráficas, la cual tiene una mayor latencia, pero le da el ancho de banda necesario para que la GPU pueda funcionar con soltura. Si PlayStation 4 se basó en GDDR5, la actual PlayStation 5 en GDDR6, entonces por lógica la apuesta de Sony en PlayStation 6 será la GDDR7. Lo cual significará como mínimo duplicar el ancho de banda, sin embargo, no es esto lo que nos interesa de cara a la próxima consola de Sony.

CaracterísticasRendimiento
Velocidad de reloj2.79 GHz
Número de núcleos72
ALUs por núcleo128
TFLOPS (FP32)40.32
Número de unidades de texturas288
Tasa de texturizado (Gtexels/s)803.52
ROPS128
Tasa de relleno357.12

No sabemos cuál será el ancho de banda real de la memoria GDDR7 de PlayStation 6, pero nosotros para nuestra especulación hemos escogido los 36 Gbps, lo que en un bus de 256 bits esto son 1152 GB/s o 2.5 veces el ancho de banda respecto a PlayStation 5, lo que significará aumentar la tasa de relleno y de texturizado en el mismo grado. Nuestra apuesta es una GPU con 72 núcleos (288 unidades de textura) y 128 ROPS a 2.79 GHz. Dado que las unidades de textura se encuentran dentro de los núcleos de la GPU, esto nos permite sumar toda la información y dar una especificación técnica completa de lo que podría ser la GPU de la futura PS6.

Claro, está que aclaramos desde aquí que esto por el momento es una especulación, pero lo vemos con un salto generacional viable respecto a la actual consola de Sony, teniendo en cuenta las limitaciones con las que se pueden encontrar durante el desarrollo. Especialmente respecto a los límites impuestos por la GDDR7 de cara al rendimiento.

Un deseo personal: PlayStation Portal mejorado e integrado de serie

La idea de un mando con pantalla se le considera una idea gafada desde el momento en que la Wii U de Nintendo tuvo el destino que tuvo, sin embargo, Sony ha tardado más de una década en copiar la idea con PlayStation Portal, pero lo ha hecho mal dado que la consola no se pensó para una intercomunicación de este tipo. El motivo de ello es sencillo, mientras que la consola de Nintendo tenía una segunda red inalámbrica solo para el mando distinta a la del WiFi para comunicarse por internet, lo que eliminaba contenciones que añaden latencia, en PlayStation Portal la comunicación se ha de hacer a través del router, haciendo que haya mayor latencia incluso que jugando en la nube.

PlayStation Portal

La idea de un PlayStation Portal 2, integrado de serie en PlayStation 6 nos puede parecer una ida de olla y un sinsentido, pero en la era donde cada uno tiene su propia pantalla personal, esto tiene mucho más sentido del que os imagináis. Además, que los costes de añadir una pantalla adicional de serie en un DualSense 2 no serían tan altas como os imagináis, ya que el periférico en la actualidad se vende a un precio con un alto margen de beneficio.

1 comentario en “¿Cómo creemos que será la PlayStation 6 en cuanto a hardware?”

  1. Lo primero que pense cuando salieron los rumores del PS6 es «Pero si acaba de salir!» y me cayo el veinte que no, ya va para los 5 años…Dios que generacion mas letargica la verdad

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio