Miyamoto nos aclara como será NX + Nueva especulación por mi parte (I)

Hace unos días tuvimos al actual presidente de Nintendo hablando de la estrategia de Nintendo y aclarando con ello ciertos puntos que teníamos en duda. Antes que nada tengo que dar las gracias a Neo East por esta perla ya que es la parte que nos confirma definitivamente que Nintendo no ha cambiado la forma de hacer hardware respecto a Wii y Wii U.

Captura de pantalla 2015-11-04 a las 13.38.32

Veamos los puntos subrayados:

  • Un sistema que consume menos electricidad.
  • Un sistema que hace menos ruido y genera menos calor.
  • Importancia en el tamaño del sistema y del medio de almacenamiento.
  • Todo el mundo lo puede adquirir.

¿No son estos los valores con los que Nintendo ha creado sus tres últimas consolas de sobremesa?

¿Particularidad entre las tres consolas? Aparte de los puntos subrayados arriba y en la que coinciden el hecho que la arquitectura general de todas ellas sea exactamente la misma. Esto es algo que ya comente en la entrada llamada Nintendo eDRAM obsesión por lo que para no repetirme de nuevo y por comodidad por mi parte os pido que le echéis un vistazo.

Es decir… que pese a toda la especulación hecha en este blog en la que todos hemos aprendido cosas sobre hardware que van más allá de lo que es la futura de consola de Nintendo en general creo que es hora de dejar el mundo de la especulación, volcar la mesa y reconocer el error de ciertos planteamientos por mi parte ya que desde el momento en que Nintendo ha definido como será su consola por boca de un alto directivo, Miyamoto, todo lo que se diga a partír de este punto y que no concuerde con las palabras de los representantes de Nintendo dejará de ser una especulación para pasar a ser una falsedad.

Es decir… es el momento de volcar la mesa.

tableflip02

La ventaja de tener un blog y uno una página de información es que te permite especular sin entrar en el compromiso informátivo, te permite ser politicamente incorrecto… Pero sobretodo te da la habilidad y el valor de especular y equivocarte, pero es que en general creo que todo el mundo nos estamos equivocando en lo que a NX se refiere y pese a que no tengo ninguna autoridad si que la tienen las palabras de Miyamoto por un lado y la tradición histórica de Nintendo por otro.

¿En que se basa mi nueva especulación? Renesas dejo de fabricar el chip Latte de Wii U porque las ventas de la consola eran muy bajas y una de las tecnologías clave era el uso de la memoria embebida en dicho procesador, la cual era implementada a través de un proceso exclusivo de la propia Renesas, es decir, nadie más podía fabricar el chip a no ser que se hiciese un enorme rediseño del mismo.

necele_08

Mi esperanza blanca era la memoria HBM, pero dados los problemas que esta teniendo y los rumores recientes de que incluso el año que viene continuara siendo una memoria para gama alta he decidido resignarse definitivamente sobre el uso de dicha memoria en NX y esperar a la siguiente generación para ver dicha tecnología en una consola. Es decir, creo que Nintendo va a optar de nuevo por la memoria embebida dentro del chip y en este aspecto tenemos dos variantes: eSRAM y eDRAM.

Si miráis la tabla de arriba veréis el tamaño enorme que ocupa la SRAM en comparación con la DRAM, esto es debido a que un mecanismo es más complejo que el otro:

sram and dram

Dado que el coste de un chip depende de su tamaño el hecho la eSRAM acabara por ocupar un espacio mucho más grande que la eDRAM y dejará menos espacio para el resto de componentes. Historicamente Nintendo no ha utilizado jamas memoria eSRAM en sus consolas y deberíamos tirar por la eDRAM, la cual puede ser colocada en un sistema de dos maneras distintas.

La primera de ellas es dentro del chip mismo:

La segunda es colocar procesador y memoria de forma separada pero en un sustrato/interposer, justo como ocurre en:

¿Ventajas y desventajas del segundo caso? Un chip multimodulo como es la segunda opción ayuda a ahorrar costes en el sistema y en el espacio de la placa, mientras se decrementa el tiempo de acceso a los datos (latencia) y se incrementa el rendimiento del sistema en general. Sin embargo, un modulo MCM también sufre de los problemas de de fiabilidad y servicio  desde que un chip defectuoso no se puede reemplazar sin reemplazar el paquete entero. No obstante existe la ventaja de que puedes colocar los diferentes chips bajo diferentes nodos de fabricación y esto facilita enormemente las cosas. ¿tiene Nintendo experiencia en chips MCM? Pues si, Wii U tiene uno donde coloca CPU y GPU.

MCM_WiiU

Y en el caso de Wii, el paquete llamado Hollywood montaba dicho procesador y la MEM1 encima de un sustrato/interposer.

hollywood_dies

Ahora bien… descartando la memoria apilada a través de una interfaz TSV y teniendo en cuenta los problemas que tendría la inclusión de memoria embebida dentro del chip en lo que a densidad se refiere entonces la solución que nos queda es la solución de la eDRAM en el paquete, es decir sobre el mismo sustrato/interposer que el procesador o el resto de procesadores.

Existe una presentación de TSMC del 2013 que hablan del uso de memoria embebida sobre sustrato/interposer (2.5D), no he podido encontrar la explicación completa pero el abstracto ya es interesante por si mismo:

Un PHY de 1 Tbit/seg (128 GB/seg) es demostrado a través de una plataforma CoWoS. Dos chips: un SoC y una eDRAM han sido fabricados bajo tecnología CMOS de TSCM a 40nm y apilados en un interposer de silició fabricado a 65nm. Un bus de 1024 DQ operando 1.1 Gbit/seg con un voltaje mínimo de 0.3V son probados en los resultados experimentales…

¿PHY? ¿CoWOS? No desespereis que todo tiene explicación. En primer lugar las siglas PHY se refieren a la interfaz física que conecta un chip con el cableado, en el caso que nos ocupa estamos hablando del cableado que se encuentra en el sustrato/interposer y que comunica el SoC con la eDRAM. En segundo lugar CoWoS en el caso de TSMC se refiere a los grupos de chips montados sobre sustrato/interposer y CoWoS significa Chip on Waffer on Substrate, donde lo llaman modulo CoWoS heterogeneo por el hecho de poder colocar chips de diferentes nodos de fabricación dentro del sustrato/interposer.

¿Os acordáis cuando hace un tiempo puse esta parte de una diapositiva en concreto?

captura-de-pantalla-2015-03-23-a-las-12-45-23

Los chips de memoria no tienen porque ser HBM sino que pueden ser eDRAM normal y corriente. En Semiwiki podemos encontrar un artículo sobre la tecnología CoWoS de TSMC donde se puede ver la fotografia de un modulo entero utilizando no un chip sino dos chips.

tsmc-cowos-test-vehicle1-2

Si nos fijamos bien en lo que hemos visto tenemos que un chip de memoria tiene un ancho de banda de 128 GB/seg, dos chips unos 256 GB/seg. Dado que el mínimo es un chip y Nintendo suele ser muy conservadora respecto a esto por el momento me voy a quedar con la eDRAM a 128GB/seg… ¿Y como se compara esto con Wii U? Bueno, la eDRAM de Wii U va a 70.4 GB/seg de ancho de banda (35.2 GB/seg para lectura y 35.2 GB/seg para escritura) pero sobre la relació GPU-Ancho de banda de la eDRAM ya entrare más adelante.

La otra parte que me interesa es la CPU… en Wii U lo que es el MCM comunica los diferentes elementos a través de buses AHB (Amba High bandwidth Bus) por lo que el uncore no utiliza tecnología de AMD, es decir, lo único AMD dentro de Wii U es la GPU y punto. Esto se sabe a través de la ingenieria inversa hecha por la gente trabajando en el homebrew de la consola (Wii U).

Captura de pantalla 2015-11-05 a las 11.40.51

¿Que importancia tiene esto? El AHB es un bus comúnmente utilizado en los SoC que utilizan CPUs con conjunto de instrucciones ARM, es decir, el uncore o anillo en el que están conectados los componentes del Latte esta más preparado para una CPU ARM que no una CPU x86 en el caso de que quisiéramos hacer un “Latte NX” e integrar una CPU en el SoC lo tendríamos muy fácil si quisiéramos integrar una CPU con conjunto de instrucciones ARM sin cambiar el uncore, lo que nos permite reciclar buena parte de los componentes del Latte en el nuevo SoC, el cual perdería la eDRAM interna (a favor que estuviese separa del chip pero encima del sustrato/interposer) pero a cambio integraría una CPU con conjunto de instrucciones ARM en su interior. Pero no sería el único cambio interno, el otro cambió sería la perdida de los elementos relacionados con la compatibilidad hacía atrás con Wii que serían eliminados definitivamente en el nuevo sistema.

¿Y que hay de la GPU elegida? No tengáis tanta prisa… la gran pregunta aquí es la compatibilidad hacía atrás… ¿La conservará Nintendo? Para ello sería necesario montar el Espresso como un chip más sobre el sustrato/interposer aparte de Latte NX y la eDRAM y conservar los pines de comunicación del Latte con los diferentes componentes en el Latte NX. Se que ante la compatibilidad hacía atrás muchos estáis pensando… Pero si Microsoft lo ha solucionado en Xbox One sin necesidad del hardware original pero dejadme decir que así no hace las cosas Nintendo y que tener el hardware original es lo único que asegura al 100% la compatibilidad hacía atrás, esto significaría además que la GX2 GPU se encontraría también en el Latte NX.

wiiudie_blocks

El Latte de Wii U tiene un tamaño de 11.88 x 12.33mm (146.48mm²) en total, la eDRAM pequeña que tiene que ver con la compatibilidad con Wii desaparecería en el nuevo sistema por completo, esta ocupa unos 4.25mm² y la eDRAM grande pasaría a estar fuera del chip, esta ocupa unos 40.72mm² por lo que el Latte sin estas dos memoria a 40nm ocuparía un área de 101.51mm² y esto se traduce que a 28nm este ocuparía unos 51mm^2 aproximadamente, lo cual es un área bastante pequeña pero con el uso de la GX2 GPU nos viene la siguiente pregunta: ¿Merece la pena colocar otra GPU o en cambio es mejor escalar la GX2 GPU en lo que al número de unidades de procesamiento se refiere? Esta claro que si se utiliza el mismo uncore de Wii U para NX hemos de tener en cuenta que este no esta preparado para computación desde la GPU al no tener ningún mecanismo de coherencia de caches entre CPU y GPU.

¿El problema de este escenario? Que es el que tiene más números de ser cierto, la tradición de Nintendo desde Wii es que las sobremesas sean compatibles hacía atrás con la consola de la anterior generación y lo mismo ocurre con las portátiles por lo que esto en realidad sería un…

1408537680_0

… para mucha gente, pero dada la filosofía y la forma de hacer las cosas en Nintendo esto cuadraría. En el caso de que esto fuera así personalmente me gustaría ver un RV740 dentro del chip, es de la misma familia que la GX2 GPU por lo que sería 100% compatible pero dispone de 640 Stream Processors en vez de 160 y unos 16 ROPS en vez de 8, su tamaño bajo el proceso de 40nm es de 136mm^2 por lo que a 28nm tendría un tamaño de 68mm^2, suficiente para caber en el “Latte NX” sin que resulte en un chip con unos costes exagerados y un tamaño tampoco exagerado.

El resto del sistema lo comentare en la siguiente entrada, es para no saturar.

Anuncios