Construyendo Nintendo NX (I): Memoria

En la pasada GTC, evento organizado por Nvidia, hablaron de su futura GPU con el nombre en Pascal. La cual será la primera GPU de Nvidia diseñada para utilizar el estandar HBM de la JEDEC por lo que AMD no será la única en hacerlo, pero esto es algo que ya se sabía desde hacía un tiempo.

¿Entonces que es lo que tendrá de especial? Pues que SK Hynix presento una oblea con chips HBM de segunda generación ya fabricados y Pascal que aparecerá a principios del año que viene los utilizara y esto es sorprendente porque el uso de este tipo de memoria se esperaba para más tarde en el tiempo.

PascalBoard-1

La GPU esta montada sobre el mismo sustrato/interposer que los cuatro chips de memoria HBM2, el sustrato/interposer es el cuadrado verde.

¿Que tiene de especial el hecho que sea de segunda generación?

HBM

Esto significa que los cuatro chips de memoria HBM2 en Pascal tendrán una densidad de 16GB o 32GB en total y un ancho de banda total de 1024 GB/seg o 1 TB/seg. Lo cual resulta impresionante si tenemos en cuenta el poco espacio que ocupan los chips y lo pequeños que son. Además dado que la memoria HBM es un estándar de la JEDEC y ha será adoptado por los dos grandes diseñadores de chips gráficos para equipos de sobremesa (AMD y Nvidia) esto significa que esto se va a estandarizar si o si y en un futuro y esto afectará al diseño no solo de las tarjetas gráficas sino también de consolas de videojuegos.

El caso es que su tiempo de aparición me parece perfecto sí tenemos en cuenta que podríamos ver a la Nintendo NX como muy pronto a finales de 2016 y tengo muy seguro que dada la importancia que le da Nintendo al espacio y al consumo en sus consolas la memoria HBM acabará siendo adoptada en su siguiente consola. Llevo tiempo dandole vueltas en mis ratos libres y lo he comentado varias veces, la forma en la que Nintendo desarrolla tradicionalmente sus consolas hace que la memoria HBM les vaya como anillo al dedo, quizas me equivoque y tiren por un camino más tradicional en cuanto al diseño del hardware. Obviamente todo esto es una especulación, la diferencia es que yo hacía mucho más lejana en el tiempo la aparición de la memoria HBM2. En cuanto a la de primera generación no la consideraba adecuada por el hecho de tener una densidad muy baja y de ahí que mi especulación hacía lo que será el siguiente sistema tirase más hacía lo que es la microconsola, pero teniendo en cuenta que en el 2016 ya será posible montar sistemas con HBM2 entonces tenemos un cambio completo de la situación.

Pero no os esperéis algo como el Nvidia Pascal que será un chip de gama alta, es más, creo que veremos configuraciones en las GPUs de PC con diferente número de chips según a la gama que pertenezcan y creo que es mucho más realista esperar en un sistema doméstico una configuración de procesador+un solo chip de memoría HBM sobre el sustrato/interposer de cara a lo que será la NX de Nintendo. Hay que tener en cuenta que un solo chip HBM2 puede dar más ancho de banda que PS4 (256GB/seg vs 176 GB/seg) y la misma densidad de memoria (8GB) pero ocupando un espacio minúsculo en comparación.

Por otro lado mi especulación anterior con memoria HBM era manteniendo el sistema de MEM1+MEM2 que ha tenido Nintendo tradicionalmente en sus consolas desde GameCube, esto era debido a que un solo módulo de memoria HBM de primera generación solo tiene 1GB de memoria, la idea era la de utilizar la memoria HBM para la misma función que la eDRAM/MEM1 de Wii U mientras que la memoria externa como la DDR3/MEM2 de la misma consola. Claro esta que con la posibilidad de utilizar memoria HBM2 desde el 2016 la situación cambia por completo ya que esta tiene una mayor densidad que la HBM, una cuatro veces más, por lo que pasaría a ser posible el hecho de prescindir de la memoria externa al sustrato/interposer.

El otro punto importante para Nintendo es el consumo energético de la memoria, el cual se mide en pJ/bit que es lo mismo que mW/Gbps. En el caso de Wii U tenemos el equivalente a un modulo DDR3-1600 o PC3-12800 ya que su ancho de banda es de 12-8 GB/seg. La memoria DDR3 tiene un consumo de 65 pJ/bit o lo que es lo mismo 65 mW/Gbps. Sabiendo que 12.8 GB/seg son 102,4 Gbps entonces es tan facil como hacer una simple multiplicación y luego dividir por 1000.

(102,4 Gbps* 65mW/Gbps)=6656mW= 6.65 W.

¿Cual es el consumo de las memoria HBM? Pues unos 7 mW/Gbps por pila, lo que significa que asignando el mismo consumo para la memoria esto es un aumento del ancho de banda de aproximadamente unas 9 veces más y ya se sabe la relación entre el rendimiento de un procesador gráfico y el ancho de banda asociado. Claro esta que lo preferente sería el uso de memoria HBM con 256GB/seg o que es lo mismo 2048Gbps que se traducen en unos 14.4 W de consumo para un ancho de banda 20 veces superior a los 12.8 GB/seg que tiene Wii U con su memoria externa y con las ventajas de utilizar un único pozo de memoria en vez de dos pozos distintos de cara al desarrollo de juegos, uno de los motivos por los cuales PS4 es aplaudida por los desarrolladores en el tema de la memoria es precisamente por eso, por utilizar un solo pozo para la memoria.

En la siguiente parte empezaremos a construir el procesador del sistema desde una perspectiva más general.

EDIT: Pues parece que me equivocaba en mis cálculos.

Lo siguiente esta sacado de una presentación de TSMC:

Captura de pantalla 2015-03-23 a las 12.45.23

Un consumo de solo 7W para una configuración de 8GB a 256GB/seg es algo que es sinceramente impresionante. Por lo que deduzco los dos chips HBM utilizados son del tipo HBM2 por la densidad, pero son cuatro chips y no ocho chips y con un ancho de banda de 128GB/seg por chip HBM. En todo caso aquí se ven las dos grandes ventajas de esta tecnología, Por un lado tenemos que el espacio ocupado es mucho más pequeño al igual que el consumo energético.

El resto de detalles ya los comentare en la siguiente entrada.

Anuncios