La Nvidia A100 de 80GB se puede ver en respuesta al lanzamiento del acelerador Instinct MI100, presentado por AMD como el primer producto construido en la GPU de computación Arcturus, el primer núcleo con una arquitectura CDNA.
AMD Radeon Instinto MI60 | Instinto AMD MI100 | Nvidia Tesla V100 | Nvidia A100 | |||
---|---|---|---|---|---|---|
GPU | Vega 20 | Arcturus | GV100 | GA100 | ||
arquitectura | GCN4 | CDNA | Hora | Amperio | ||
formato | PCIe | PCIe | SXM2 | PCIe | SXM4 | SXM4 |
CU / MS | 60 | 120 | 80 | 108 | ||
FP32 jader | 3840 | 7680 | 5120 | 6912 | ||
FP64 jader | – | – | 2560 | 3456 | ||
INT32 jader | – | – | 64 | 64 | ||
INT32 jader | – | – | 5120 | 6912 | ||
Tensor de colores | – | ? | 640 | 432 | ||
Velocidad | 1800 MHz | 1502 MHz | 1530 MHz | 1410 MHz | ||
↓↓↓ T (FL) OPS ↓↓↓ | ||||||
FP16 | 29,5 | 184,6 | 31,4 | 78 | ||
BF16 | ![]() | 92,3 | ![]() | 39 | ||
FP32 | 14,7 | 23,5 46,1 | 15,7 | 19,5 | ||
FP64 | 7,4 | 11,5 | 7,8 | 9,7 | ||
INT4 | 118 | 184,6 | ? | ? | ||
INT8 | 59,0 | 184,6 | ? | ? | ||
INT16 | 29,5 | ? | ? | ? | ||
INT32 | ? | ? | 15,7 | 19,5 | ||
Tensor FP16 | ![]() | 184,6 | 125 | 312/624 * | ||
Tensor BF16 | ![]() | 92,3 | ![]() | 312/624 * | ||
Tensor FP32 | ![]() | 46,1 | ![]() | 19,5 | ||
Tensor TF32 | ![]() | ? | ![]() | 156/312 * | ||
Tensor FP64 | ![]() | ![]() | ![]() | 19,5 | ||
Tensor INT8 | ![]() | 184,6 | ![]() | 624/1248 * | ||
Tensor INT4 | ![]() | ? | ![]() | 1248/2496 * | ||
↑↑↑ T (FL) OPS ↑↑↑ | ||||||
TMU | 240 | 480? | 320 | 432 | ||
autobús | 4096 bits | 4096 bits | 4096 bits | 5120 bits | ||
memoria | 32 GB | 32 GB | 32 GB / 16 GB | 40 GB | 80 GB | |
HBM2 | 2,0 GHz | 2,4 GHz | 1,755 GHz | 2,43 GHz | 3,2 GHz | |
pam. apuntalar. | 1024 GB / s | 1229 GB / s | 900 GB / s | 1555 GB / s | 2048 GB / s | |
TDP | 300 W | 300 W | 300 W | 250W | 400 W | 400 W |
Transistorů | 13,2 mil millones | 50.000 millones? | 21,1 mil millones | 54,2 mil millones | ||
Área de la GPU | 331 mm² | 750 mm²? | 815 mm² | 826 milímetros² | ||
proceso | 7 nm | 7 nm | 12 nm | 7 nm | ||
fecha | 2018 | 11. 2020 | 2017 | 6. 2020 | 5. 2020 | 11. 2020 |
La diferencia entre las versiones de 80GB y 40GB del V100 radica, como sugiere la etiqueta, en el doble de la capacidad de memoria, que también se ha acelerado de 2,43 GHz efectivos a 3,2 GHz (denominado HBM2E), lo que significa un rendimiento de datos de hasta hasta 2048 GB / s. La configuración del kernel y, por tanto, la potencia informática como tal, no cambia; Sin embargo, Nvidia presenta una diapositiva de hasta un aumento múltiple en el rendimiento real.
Esto se puede lograr con la condición de que el bloque de datos con el que trabaja el acelerador no quepa en la memoria integrada en la versión de 40GB, o no quepa en la memoria en su totalidad en ninguna versión, pero sus partes esenciales encajen en 80GB.
El A100 80GB estará disponible en la versión SXM4, es decir, en forma de módulo, lo que significa disponibilidad solo dentro de todo el sistema, no minorista (como con las tarjetas PCIe). Nvidia no anunció el precio, para una orientación aproximada se puede recordar que el 40GB A100 se basa en alrededor de $ 10,000.
*The article has been translated based on the content of Diit.cz by diit.cz. If there is any problem regarding the content, copyright, please leave a report below the article. We will try to process as quickly as possible to protect the rights of the author. Thank you very much!
*We just want readers to access information more quickly and easily with other multilingual content, instead of information only available in a certain language.
*We always respect the copyright of the content of the author and always include the original link of the source article.If the author disagrees, just leave the report below the article, the article will be edited or deleted at the request of the author. Thanks very much! Best regards!