Nvidia en NX (III)

Aprovecho para responder dos comentarios recientes:

Comentario#1:

No te olvides del detalle de que los flops de nvidia cunden mas en rendimiento real en juegos. la geforce 750 rinde ligeramente mas en la mayoria de multiplataformas que la gpu de ps4, y eso combinandola solo con un i3. hay así muchos videos en youtube.

no me extrañaria que eso de mas cerca de one que de ps4 sea en terminos de flops teoricos ya que se trata de un articulo de hardware, pero el rendimiento real estaría mas cerca de ps4 porque la 750 rinde 1,4 tflops teóricos y supera a los 1,8 de amd en ps4.

No, no me olvido de ello y del hecho de que la comparación de FLOPS solo es válida entre sistemas bajo una misma arquitectura, ya que los FLOPS es la cifra máxima de rendimiento teórico y siempre hay elementos adicionales que pueden afectar a dicho rendimiento. Sobre el tema concreto de la 750 y los 640 SPs mi idea viene de observar el tamaño de los bloques GTC del Pascal P100 que Nvidia lo define de la siguiente manera:

El GP100 consigue su rendimiento colosal proveyendo seis GPX, hasta 60 SMs… Cada SM tiene 64 unidades CUDA y hasta cuatro unidades de texturas, pera un total de 3840 unidades CUDA y 240 unidades de texturas.

Lo que se traduce en que cada GTC…

Captura de pantalla 2016-05-14 a las 11.24.11

… Tiene unos 10 SM y por tanto 640 SPs, es decir… Estamos hablando de una configuración de la GeForce 750 Ti (Maxwell) pero bajo arquitectura Pascal, lo que significa que:

  • 16nm FinFet de TSMC en vez de 28nm, lo que significa una reducción en el tamaño del chip (coste) y en el consumo del mismo.
  • Es una arquitectura de GPU algo más avanzada por lo que su rendimiento por FLOP es superior a Maxwell.

Curiosamente esos 640 SPs equivalen al 25% de la potencia de la GeForce GTX 1080, la cual por su configuración…

Captura de pantalla 2016-05-14 a las 10.24.48

… podemos deducir que esta compuesta por 4 GPCs… Aunque de lo que estoy hablando de cara a NX es de un solo GPC y por tanto de una configuración de 640 SPs/Núcleos CUDA. La configuración como bien dice Xarman es la de la 750 Ti (Maxwell)… la misma GPU que se utiliza en el Alienware Alpha cuyo tamaño es más pequeño que PS4 y Xbox One (aunque se ha de tener en cuenta que no dispone de unidad lectora).

fcifbgd7qunqf9qqvoac

Se ha de tener en cuenta que al contrario del Alpha, el cual incluye CPU y GPUs separados en este caso estaríamos hablando de un SoC con todos los componentes integrados por lo que la placa base sería mucho más simple y compacta que esto:

img_3607-100532186-large

Por no hablar que una configuración UMA utilizando memoria GDDR5 de 128 bits simplica la placa base y no nos podemos olvidar que en el caso de que estemos hablando de un SoC basado en Pascal el proceso sería de 16nm FinFet+ por lo que el tamaño y el consumo de esta solución sería mucho menor que el del Alienware Alpha que consume unos 130W con CPU y GPU separadas, configuración de memoria no unificada y nodo de 28nm.

Comentario #2:

1/4 de la 1080? JAJAJAJJAJAJAJAJ. EJEM, en serio, seria demasiado bueno para ser nintendo.

1/4 de 9 Tflops son….mucho de todas formas, bajemos la frecuencia un 40% para que consuma menos (como si no fuera poco 45w…) Quedariamos en 1,35 Tflops, seria una 750Ti (que para variar ya es mas rendidora que la gpu de ps4) con arquitectura moderna encima, y mas vram.

Estamos hablando de una de las empresas mas malvadas del planeta (? Nvidia. El marketing que le harian seria BRUTAL, ni hablar de fanaticos enfermos con la marca.

Ademas, las gpu de nvidia son bastante mas rendidoras y eficientes que las de amd, necesitaria en promedio un 20/30% menos de ancho de banda para rendir igual (una 980ti con 337gb/s rinde igual o mejor que una fury x con hbm) Ni hablemos de las mejoras en compresion de texturas.

Sumemosle lo de los kits de desarrollo, facilidad para portar desde pc, menor calentamiento en el SoC…MUY bueno para ser cierto.

Pero muy interesante el articulo tambien.

Precisamente pueden subir y bajar la frecuencia de la GPU pero la comparación con la 750 Ti y el tema de los FLOPS que comentas me parece interesante porque esto explicaría lo que dijo Rogers que en especificaciones (sobre el papel) se acerca más a Xbox One, la gracia estaría en como ha dicho Xarman que esos FLOPS rinden mejor que los de AMD.

Comentario#3:

@xarman.

Si de verdad estas hablando de la GTX 750, recuerda que ESA GPU tiene 1 TFLOP y la GTX750Ti es la que tiene 1.3 TFLOPS:

https://www.techpowerup.com/gpudb/1986/geforce-gtx-750

https://www.techpowerup.com/gpudb/2548/geforce-gtx-750-ti

No hay que olvidar que es Nintendo, asi que puede irse a la mas capada de las opciones disponibles. :s

Tu lo has dicho, las GPUs con menos TFLOPS de Nvidia suelen rendir mas que las variantes de AMD con mas TFLOPS (digamos en cierto rango de precio), la cosa es que como tu tambien has dicho, el escenario ideal en ambiente PC-Windows, es que se acompañara la GPU con un procesador Intel i3/i5/i7 y todos sabemos que eso no va a ocurrir en el caso de NX (aunque seria interesante); creo que cuando dices “combinandola solo con un i3” no te das cuenta que ese CPU es mas potente en su conjunto que los que llevan PS4/XBO y desde luego que el de la NX, sobre todo cuando tenemos en cuenta las caracteristicas de los motores, de la programacion y de que la gran mayoria de juegos de la actual Gen estan basados en Dx11, no por nada luego aun vemos juegos CPU-demandantes como GTAV, FarCry4 etc.

Hombre se podria seguir jugando de lo lindo con un simple Pentium G + OC (2 nucleos), pero entre que salen juego capados adrede (para que no funcionen estando un doble nucleo), que tambien se esta apuntando a tener al menos 4 hilos (que es donde entra el Intel i3, pero sobre todo el i5) y a que se habra de implentar las APIs mas eficientes a la hora de utilizar los nucleos disponibles en CPU/GPU (ya llegaran los juegos Dx12/Vulkan nativos), pues en ambiente PC un micro reciente de 4 nucleos es lo minimo indispensable hoy en dia y a futuro (mas los rigurosos 8GB de ram etc etc etc), pues un doble nucleo por mas Ghz le saques, se ahoga/ahogara ante un juego mas eficiente en la demanda de nucleos/hilos (que en cierta forma es el mismo caso de GTAV y no se diga de Crysis3 en el mapa Welcome to the Jungle).

Ya que hablo de GTAV…Intel i3 3250 a 3.5Ghz (Ivybridge 2 nucleos + hilos), 8GB ram DDR3, una GTX750 2GB GDDR5 (sin la “Ti”). 1600x900p/Texturas en Normal y otras variables en calidad Alta/Muy Alta, consumo Vram de 1.5-1.8GB > Framerate 40-50fps (asentado mas en los 45fps):

De nuevo, GTAV (no es el mismo escenario ni exactamente la misma configuracion, pero es lo que hay)…APU AMD 5350 a 2Ghz (Core Kabini/Arquitectura Jaguar 2 modulos/4 nucleos), 8GB de ram DDR3, GTX750 2GB GDDR5, 1920x1080p/Texturas en Normal y otras variables en Alta/Muy Alta, consumo de la Vram de desconocido (pero debe superar facilmente el 1.5GB), Framerate 30-40fps (asentado mas en los 35fps).

* A menor resolucion y mas aun tratandose de un juego demandante de potencia por nucleo y bajo Dx11…mas vale tener un Intel i3 que cualquier AMD, asi sea de bajo consumo, para HTPC o la gama “entusiasta de AMD” actual (del 2012 para aca), en otras palabras, se le ha hecho un gran favor al Kabini jugando a 1080p y aun asi va por detras. xD

Se entiende a donde voy o a donde he llegado?.😉

Se te entiende perfectamente, en todo caso el SoC de NX si lleva una CPU va a ser una ARM y que nadie se asuste por ello porque si es un Nvidia Denver o un A72 se puede decir que a igualdad de velocidad de reloj utiliza el Jaguar de AMD para fregar el suelo. Por lo que ese aspecto no me preocupa, más bien me preocuparía la CPU de Netbook que continuara teniendo la PS4K y que se convierte en un cuello de botella para la GPU en la nueva iteración de la consola de Sony.

Anuncios