Construyendo Nintendo NX (III): Procesador

Voy a partir de la siguiente configuración de ejemplo, la cual ya visteis en la primera entrega:

NXSpeculation

Tradicionalmente Nintendo y desde GameCube suele agrupar todas esas funciones menos la CPU en un chip al que Nintendo llama System LSI. Siendo bautizados históricamente como Flipper (GameCube), Hollywood (Wii) y Latte (Wii U), siendo el esquema general de los sistemas de Nintendo el siguiente:

NintendoLSI

En el caso de GCN/Wii la VRAM eran los 3MB integrados dentro del chip como cache de texturas y para el backbuffer y el z-buffer. En el caso concreto de Wii la memoria interna o MEM1 eran los 24MB de memoria 1T-SRAM dentro del mismo encapsulado:

hollywood_dies

Ya en el caso de Wii U la memoria interna y la VRAM forman parte de un mismo pozo de memoria que se encuentra dentro del System LSI “Latte” que son los 32MB de memoria embebida:

 

Con el uso del estándar de memoria HBM ya no hace falta el uso de memoria embebida dentro del procesador por lo que no se tiene que gastar parte del área del procesador en darle espacio a la memoria embebida.

La otra ventaja a la hora de utilizar memoria HBM es que su interconexión con el sustrato/interposer es en matriz y no lineal, esto se traduce en que el chip no acaba siendo inmenso para poder colocar en serie las conexiones para la interfaz de 1024 bits, sino que lo puede hacer una matriz de 32×32 bits conectada al mismo sustrato/interposer que es donde se encuentra todo el cableado desde el procesador a la memoria.

Nintendo siempre ha sido muy modesta con el tamaño de los chips de sus consolas, el Flipper de GCN tenia un tamaño de 120mm^2, el Hollywood (sin contar el chip de la MEM1) unos 72mm^2 y el Latte unos 147mm^2 aproximadamente, es por ello que pienso que los 180mm^2 lo considero algo en linea con lo que Nintendo monta habitualmente en sus consolas.

¿Un chip de 180mm^2 son buenas o malas noticias?

Depende del proceso de fabricación que escoja Nintendo para su procesador, si son 28nm son malas noticias porque el área de los chips de PS4 y Xbox One es el doble, aunque en este último caso tendríamos que descartar lo que ocupa la ESRAM para hacer una comparación más justa, por lo que para hacer más comprensible la cosa lo mejor es comparar directamente con el procesador de PlayStation 4, el cual tiene un área de 348mm^2. Sí en cambio hablamos de un proceso de 20nm entonces la cosa ya cambia ya que hablamos de un equivalente a 360mm^2 si el proceso utilizado para el chip de la NX se fabrica bajo el proceso de 20nm. No obstante tenemos que tener en cuenta que en el caso de PS4 y Xbox One ambos chips no son SoCs completos ya que relegan todas las funciones de la gestión de E/S a otros chips fuera del procesador principal, sobre el tema de las interface de E/S ver la entrada anterior.

¿Cual sería la configuración? Hemos de tener en cuenta los planes de Nintendo para el sistema unificado entre portátil y sobremesa. Si tiene que existir una compatibilidad al 100% entre ambos factores forma entonces el sistema de sobremesa no puede llevar un x86-64 como CPU y es aquí donde entra lo interesante ya que a partir del proceso de 20nm los SoC de AMD se montarán tanto con una CPU x86-64 o con una CPU ARM, siendo el Cortex A57 el primer chip que utilizarán.

amd-project-skybridge-arm-x86-640x360

¿Como se compara el Cortex A57 frente al AMD Jaguar? Teniendo en cuenta que estamos hablando de un chip pensado para sistemas como smartphones, tablets y similares en principio tenemos que tener en cuenta que su rendimiento/consumo tiene que ser mejor que el Jaguar en ese aspecto… ¿Pero como se compara con el Jaguar utilizado en PS4 y Xbox One? Pues por lo que he podido saber ambos chips y en igualdad de condiciones en cuanto a número de núcleos y velocidad de reloj están a la par, por lo que la consola al contrario de lo que ocurrió con Wii U no tendria desventaja en cuanto a la CPU se refiere.

La GPU en cambio sería del tipo GCN con soporte completo para HSA por lo tendríamos la misma tecnología que PS4 y Xbox One, lo que facilita enormemente el hecho de portar los motores gráficos, APIs, herramientas y la experiencia desarrollada en otros sistemas en este nuevo sistema en un tiempo que sería muy corto, por lo que en este caso es la mejor configuración que puede escoger Nintendo de cara a su siguiente consola de sobremesa con tal de conseguir el apoyo de terceros en forma de juegos.

Ahora bien, ¿de que configuración estamos hablando exactamente y que de potencia aproximada? Aquí es donde entramos ya en aguas pantanosas en lo que a la especulación se refiere, mi apuesta es por un AMD Bonaire como GPU, el cual a 28nm tiene un tamaño de 180mm^2 por lo que a 20nm el tamaño de la GPU en el chip pasaría a ser de 90mm^2 utilizando el proceso de 20nm y dado que el AMD Bonaire es el mismo chip utilizado en el SoC de Xbox One nos podemos esperar una potencia cercana a la potencia de la GPU de Xbox One pero sin la desventaja de tener que lidiar con la ESRAM como ocurre en la consola de Microsoft ya que la memoria HBM puede otorgar el mismo ancho de banda que la ESRAM pero sin la desventaja de la densidad de almacenamiento.

Por otro lado no nos tenemos que olvidar que los 256GB/seg de ancho de banda de la memoria HBM2 significan 128 GB/seg para lectura y 128 GB/seg para escritura, pero dicho ancho de banda se puede calibrar hacía abajo si es necesario reduciendo la velocidad de reloj de la memoria HBM2, en todo caso no hay que olvidar que Bonaire es un chip con 16 ROPS y la arquitectura GCN puede escribir 8 bytes/ROP por ciclo de reloj, esto nos daría una velocidad de reloj de 1Ghz para la GPU, lo que se traduciría en el caso de utilizar la configuración de 12 CU en unos 1.53 TFLOPS si la GPU va a esa velocidad de reloj o en en 1.79 TFLOPS en el caso de la configuración con 14 CU a 1 Ghz, lo que colocaría al sistema al mismo nivel en potencia de cálculo que PS4, aunque no podemos descartar el hecho que Nintendo puede bajar la velocidad de reloj tanto del chip como de la memoria con tal de aumentar el número de chips buenos por oblea y bajar los costes de producción de la consola y con ello el precio final de la misma.

El punto final es el consumo, no hay que olvidar que la GPU Bonaire utilizada en el HD 7790/R7 260X en su formato tarjeta con memoria GDDR5 tiene un consumo de 85W:

BonaireSpecs

 

Mi especulación para el procesador de la Nintendo NX es precisamente un chip del mismo tamaño, unos 180mm^2 pero siendo un SoC completo y no solo la GPU, por otro lado no podemos olvidar que el consumo arriba especificado es con memoria GDDR5 y la diferencia de consumo entre la GDDR5 y la HBM tal y como hemos visto en la primera entrada es bastante considerable:

Captura de pantalla 2015-03-23 a las 12.45.23

En fin, con esto termino la serie. Tened en cuenta que esta es completamente especulatoria y si el diseño final se acerca a la realidad o llega a cuadrar al 100% no será más que una coincidencia.

Anuncios