¿La próxima RTX 40 es 2 veces más rápida que la RTX 30?

Este es el rumor del día sobre las próximas tarjetas de Nvidia. Estas nuevas filtraciones provienen de Kopte7kimi y hablan de un diagrama de bloques de arquitectura verde de próxima generación. La imagen del diagrama de bloques de la GPU AD102 «Ada Lovelace» nos permitirá predecir el rendimiento del próximo RTX 40.

RTX 40: especificaciones impresionantes (si es cierto)

Primero, la GPU Ada Lovelace AD102 tendrá hasta 12 GPC (Grupos de procesamiento de gráficos). Esto es un 70% más que el GA102 (el más grande de la gama actual) que solo tiene 7 GPC. Cada GPU constará de 6 TPC y 2 SM, coincidiendo con la configuración del chip existente. Cada SM (multiprocesador de transmisión) contendrá cuatro subnúcleos, que también corresponden a la GPU GA102. El cambio real es la configuración central de FP32 e INT32. Cada subnúcleo constará de 128 bloques FP32, pero los bloques FP32 + INT32 combinados serán hasta 192. Esto se debe a que los bloques FP32 no comparten el mismo subnúcleo que los bloques IN32. Los 128 núcleos FP32 están separados de los 64 núcleos INT32.

Una de las imágenes esquemáticas de la GPU RTX 40 de Kopte7kimi.

El caché debería ser otra área en la que NVIDIA ha hecho todo lo posible en comparación con las GPU Ampere existentes. Las GPU Ada Lovelace contendrán 192 KB de caché L1 por SM, un 50 % más que Ampere. Esto suma un total de 4,5 MB de caché L1 en la GPU AD102 de primera línea. El caché L2 se incrementará a 96 MB, lo que se menciona regularmente en varias filtraciones. Eso es casi 16 veces más que la GPU Ampere, que solo tiene 6 MB de caché L2. El caché será compartido por la GPU.

Si las filtraciones son correctas, tenemos un aumento exponencial en la memoria caché L2 a 96 MB para el AD102. En cuanto a ROPs, tendríamos el doble de bloques en esta arquitectura, 32 por GPC para ser exactos, lo que nos daría un total de 384 ROPs para una posible RTX 4090 frente a 112 para una RTX 3090… Sobre el papel, esto es monstruoso .

Comparación de características de GPU. El AD102 será el pináculo de la línea RTX 40.

Pero tras esta orgía de datos técnicos, ¿qué beneficios podemos esperar?

Obviamente, todavía es demasiado pronto para tener una idea exacta, pero si se confirman estos elementos, la hoja técnica mostrará una gran diferencia en comparación con el Ampere. Para resumir :

X2 GPC (frente a amperios)
50 % más de núcleos (en comparación con Ampere)
50 % más de caché L1 (en comparación con Ampere)
Caché 16x L2 (en comparación con Ampere)
ROP X2 (en comparación con Ampere)
Núcleos Tensor de 4.ª generación y Núcleos RT de 3.ª generación

Pero, ¿qué podemos esperar en términos de rendimiento real?

Esto es muy difícil porque nos falta un dato clave: la frecuencia de funcionamiento.

Pensándolo un poco, podemos diseñar la potencia del FP32 a 90 TFLOPS, que es más del doble que el actual GA102. Sin embargo, con TFLOPS también podemos tener sorpresas. Si dan una idea del rendimiento bruto, nunca permiten un juicio sesgado de los resultados en el uso “cotidiano”. Anuncios filtrados de x2 por x2.2 en comparación con el RTX 30… El aumento será claramente, parece significativo. Pero para decidir más, tendremos que esperar un poco más.

RTX 40: especificaciones impresionantes (si es cierto)

Pero tras esta orgía de datos técnicos, ¿qué beneficios podemos esperar?

Deja una respuesta Cancelar la respuesta