El futuro de las APUs/SoC de AMD en PC

Desde hace un tiempo que AMD esta hablando de cara al futuro de separar las piezas de un SoC en diferentes chips encima de un modulo multichip sobre un interposer.

FutureInterposer

Recientemente han empezado a darle forma a la idea de cara al futuro y teniendo en cuenta ciertas limitaciones de los SoCs tiene bastante sentido, en especial si tenemos en cuenta los cuellos de botella asociados.

7e42c9447e754167c85105ffe1a1d866_L

Los cuatro buses GMI en este caso suman unos 100 GB/seg de ancho de banda y son la parte coherente que comunica la GPU con la memoria del sistema. Siendo Zeppelin la CPU, es decir, los cuatro buses GMI hacen la misma tarea que el bus coherente en el siguiente diagrama:

AMDUncore

La diferencia es la separación en cuanto a memoria entre el bus coherente y el bus no-coherente en la diapositiva de AMD… ¿Que sentido tiene el hecho de separar el bus coherente del no-coherente en dos memorias distintas? El motivo es que seguramente el ancho de banda de la memoria DDR4 (100GB/seg) resulta en un cuello de botella demasiado grande para la GPU “Greenland” que existe en el diagrama. Por otro lado el espacio de memoria no-coherente no necesita ser accedido por otros procesadores excepto la GPU por lo tiene sentido dicha separación, en realidad incluso si tenemos un sistema de memoria física unificada habrá un segmento de la memoria reservado para la GPU, el cual no será coherente, dicho segmento de memoria es para el renderizado de la escena mientras que el segmento coherente es para tareas donde la GPU realiza tareas de apoyo a la CPU en tareas de propósito general.

No hace mucho puede encontrar una patente de AMD donde se hablaba precisamente del mismo concepto, la podéis encontrar aquí y su diagrama principal es el siguiente:

Captura de pantalla 2015-12-09 a las 17.16.28

Veamos la descripción de cada uno de los componentes.

El conector eléctrico 400 incluye dos porciones de conector. Una primera porción (402) que incluye el soporte de un slot PCI (de por ejemplo 16 nodos). Una segunda porción del conector (404) incluye contactos adicionales (por ejemplo cuatro nodos HyperTransport) requeridos para un slot Hypertransport.

¿No os recuerda a esto que puse la semana pasada? Fijaos de momento en el diagrama y olvidad lo que comente la otra semana ya que os haréis un lío.

export

La única diferencia es la mención de nodos HyperTransport.

Un componente PCI puede ser conectado a la primera porción del conector y dejar la segunda porción sin utilizar.

¿Pero son completamente prescindibles?

Un componente compatible con un enlace HyperTransport se puede conectar a ambas partes del conector.

Es decir, podemos utilizar una interfaz PCI Express o una interfaz Hypertransport para comunicar la GPU con el Northbridge de la CPU, ya que en este caso estamos hablando de que ambas sean chips distintos pero encima de un mismo sustrato/interposer. Es decir, la GPU en este caso no tiene acceso directo a la memoria RAM principal sino que hace pasar por el Crossbar Switch/Northbridge de la GPU para acceder a ella. Obviamente el uso de una serie de nodos HT para comunicar CPU y GPU tienen mucho más sentido que un puerto PCI Express en el caso que nos ocupa.

¿Pero la pregunta clave es… Cual es el motivo de volver a separar CPU y GPU de nuevo? El motivo es que lo más seguro es que el chip combinado resultante de esta configuración sea un chip de tamaño enorme que haga que el rendimiento de la obleas durante la fabricación caiga en picado y el coste del chip suba en consecuencia. Es más, la mención del AMD Greenland y de la memoria HBM hace pensar que nos encontramos ante lo siguiente que puede ser esto…

Zen16

Curiosamente las especificaciones coinciden de mala manera que con esta diapositiva de hace unos meses por lo que queda claro que hablamos de un mismo concepto, en todo caso aclarar que el sistema definido hasta ahora no esta pensado para un sistema doméstico sino para la computación de alto rendimiento, claro esta que la computación de alto rendimiento incluye también la reproducción de videojuegos a alto nivel, un espacio exclusivo del PC de gama muy alta y no para el mercado de masas y aún menos para las consolas de videojuegos domésticas.

Anuncios