NX: ¿No hay HBM 2 disponible? (II)

Esto es un pequeño añadido a la entrada de hace unos días.

Supongamos que al final Nintendo escoge un SoC+HBM de AMD como hardware principal de NX como consola de sobremesa, obviamente esto es una suposición y no una afirmación por lo que la entrada será meramente especuladora.

Hemos quedado que la especificación de la memoria gráfica serían unos 128 GB/seg de ancho de banda para la GPU, esto son 64GB/seg de ancho de banda para escritura por lo que si tenemos en cuenta que las GPUs de las series GCN pueden escribir hasta 8 bytes de color por pixel entonces tal y como vimos en PS4 y Xbox One:

HumuseDRAM

La ESRAM de Xbox One en modo escritura son unos 109 GB/seg que es la tasa para los 16 ROPS a 853 Mhz y 8 bytes por pixel. En el caso de la configuración de la que estamos hablando entonces en el caso de que el sistema tuviese 16 ROPS como Xbox One la velocidad de reloj de la GPU seria de:

(64 GB/seg)/(16 ROPS*8 bytes por ROP)= 500 Mhz

La nueva GPU funcionaria a unos 500 Mhz de velocidad de reloj. ¿Tiene sentido esta velocidad más baja que la competencia? Nintendo anda obsesionada con el consumo energético en sus consolas y uno de los elementos relacionados con el consumo energético es la frecuencia de reloj, ya que la formula del consumo energético de todo circuito integrado es:

P = f*c*V^2

Donde f es la frecuencia dentro de la formula por lo que a medida que subimos la velocidad de un procesador esta no sube linealmente sino exponencialmente.

¿Cual es el nivel visual que podemos esperar? Tomemos como base el nivel de Wii U:

xenoblade_chronicles_x-7

1381512525385-1

Estos juegos de Wii U funcionan a una resolución de 720P por lo que aún existe el margen en la potencia para colocarlos a 1080P nativos.

La diferencia entre 720P y 1080P es de 2.25 veces y en el caso de Wii U tenemos que la consola tiene una potencia de 176 GFLOPS pero la comparación no es buena y lo mejor es tener en cuenta el número de hilos/kernels que la GPU ejecuta al vuelo, 192 en total en el caso de Wii U por lo que un salto a los 1080P necesitaría de entrada unos 432 hilos pero en el caso de las GPU de AMD los hilos van en paquetes de 64 por lo que vamos a redondear la cosa a 448 hilos de ejecución pero de nuevo nos encontramos con otro problema:

Compute Unit

Las Compute Unit de la arquitectura GCN procesan en grupos de 4 por lo que de nuevo tenemos que subir y nos quedamos en los 512 hilos de ejecución que equivaldrían a unos 512 Stream Processors u 8 CUs, en la GPU. Se que por el momento es bastante decepcionante pero esa es la especificación mínima para mover los juegos de Wii U, no obstante hay un pequeño detalle que cambia las cosas y para explicarlo voy a tomar el AMD Carrizo que es el ultimo SoC de AMD para PC y varias GPUs contemporáneas que utilizan arquitectura GCN 1.2.

Carrizo_GPU_diagram-617x732

Carrizo tiene unos 2 RB (Render Backend) que son unos cuatro ROPS en total cada una, por lo tenemos unas cuatro CUs por ROP, ahora veamos algo que se va repitiendo en las diferentes GPUs de AMD de arquitectura GCN.

Tonga:

285Block

Hawaii:

AMD-Hawaii-GPU-Diagram-Leaked-Shows-Four-Shader-Engines-390754-2

Fiji:

Fiji

En todos ellos se puede observar que la asignación por RB es de 3 o 4 CUs por lo que una configuración con 4 RBs (16 ROPS) puede venir en una de la siguientes formas:

  • 3+3+3+3= 12 CUs. (768 GFLOPS)
  • 3+3+3+4= 13 CUs (832 GFLOPS)
  • 3+3+4+4= 14 CUs (896 GFLOPS)
  • 3+4+4+4= 15 CUs (960 GFLOPS)
  • 4+4+4+4= 16 CUs (1024 GFLOPS/1 TFLOPS)

La otra posibilidad es que tenga la configuración de 1/4 del AMD Fiji por el hecho de disponer de 1/4 de lo chips de memoria y por tanto del ancho de banda.

Captura de pantalla 2016-01-08 a las 17.05.35

Lo cual son 16 CUs, por lo que la cosa quedaría así y no tengo más que añadir.

 

Anuncios