L'acceleratore Hopper H100 stupisce anche NVIDIA: è più potente di quanto dichiarato in origine

L'acceleratore Hopper H100 stupisce anche NVIDIA: è più potente di quanto dichiarato in origine

NVIDIA ha aggiornato i dati sulla potenza di calcolo dell'acceleratore H100: da 30 e 60 TFLOPs con calcoli FP64 e FP32 si passa a 34 e 67 TFLOPs. Un miglioramento probabilmente dovuto a una frequenza operativa del chip più alta delle attese iniziali.

di pubblicata il , alle 08:01 nel canale Schede Video
HopperNVIDIA
 

NVIDIA ha rivisto verso l'alto le prestazioni dell'acceleratore H100 basato sulla GPU GH100 "Hopper", un mostro da 80 miliardi di transistor offerto in formato SXM5 e PCI Express 5.0.

In origine NVIDIA aveva indicato per la soluzione SXM5 prestazioni di calcolo FP64 fino a 30 TFLOPs, mentre il valore FP32 raggiungeva 60 TFLOPs. Adesso, sul proprio sito, l'azienda riporta valori rispettivamente di 34 e 67 TFLOPs. Per quanto riguarda la variante PCIe, invece, si passa dai precedenti dati di 24 e 48 TFLOPs ai valori aggiornati di 26 e 51 TFLOPs.

Salgono anche gli altri valori legati alle capacità dei Tensor core, così come la bandwidth di memoria della variante SMX5, con un balzo da 3 a 3,35 TB/s. Dietro ai miglioramenti nella potenza di calcolo c'è senza dubbio un incremento della frequenza operativa, stimato in circa 200 MHz.

Come abbiamo segnalato qualche giorno fa, la produzione degli acceleratori H100 è finalmente entrata nella fase "in volumi" e questo ha evidentemente portato NVIDIA e TSMC a valutare la possibilità di impostare clock più alti rispetto a quanto supposto in origine. Non è dato sapere se la società sia stata troppo conservativa in passato oppure se la produzione sta andando meglio delle attese.

La GPU H100 viene realizzata con processo 4N, descritto come una versione ottimizzata per NVIDIA dei 5 nm (N5) di TSMC. La stessa tecnologia è alla base delle GPU Ada Lovelace a bordo delle schede video GeForce RTX 4000, in arrivo sul mercato a partire dal 20 ottobre con la GeForce RTX 4090.

5 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Sp3cialFx04 Ottobre 2022, 09:10 #1
siamo ormai ai 2 petaflops in INT8 / FP8 (senza sparsity), sticazzi
joe4th04 Ottobre 2022, 11:21 #2
Quindi ratio FP64/FP32 1:2. Bisognerebe capire se quei 34 TFLOPS in FP64 sono "semplici" oppure riferiti al FP64 tensor core. La precedente A100, infatti aveva 9.7 TFLOPS FP64 e 19.5 TFLOPS tensor core. Mi sembrerebbe strano che siano riusciti a triplicare le prestazioni FP64, dove di solito tengono il braccino corto.

Comunque vedremo quale sistema T500 equipaggeranno...
Gyammy8504 Ottobre 2022, 12:08 #3
Originariamente inviato da: joe4th
Quindi ratio FP64/FP32 1:2. Bisognerebe capire se quei 34 TFLOPS in FP64 sono "semplici" oppure riferiti al FP64 tensor core. La precedente A100, infatti aveva 9.7 TFLOPS FP64 e 19.5 TFLOPS tensor core. Mi sembrerebbe strano che siano riusciti a triplicare le prestazioni FP64, dove di solito tengono il braccino corto.

Comunque vedremo quale sistema T500 equipaggeranno...


Sono 34 normali e 67 con i tensor
La mi250x fa 47,9 normali e 95,7 con le matrici, la h100 arriva a 700 watt mentre la amd max 560 watt
La metteranno in sistemi ia, ma a livello generico e alta precisone resta sempre sotto
Sp3cialFx04 Ottobre 2022, 12:12 #4
Originariamente inviato da: joe4th
Quindi ratio FP64/FP32 1:2. Bisognerebe capire se quei 34 TFLOPS in FP64 sono "semplici" oppure riferiti al FP64 tensor core. La precedente A100, infatti aveva 9.7 TFLOPS FP64 e 19.5 TFLOPS tensor core. Mi sembrerebbe strano che siano riusciti a triplicare le prestazioni FP64, dove di solito tengono il braccino corto.

Comunque vedremo quale sistema T500 equipaggeranno...


FP64: 34 base, 67 tensor core
joe4th04 Ottobre 2022, 19:27 #5
Originariamente inviato da: Sp3cialFx
FP64: 34 base, 67 tensor core


OK, grazie, quindi 34 TFLOPS base, che diventano 26 TFLOPS per la versione PCIe, magari abbinato a un dual EPYC 7773X (che un 3 TFLOPS li dovrebbe fare), senza l'ambaradan custom SMX5. Peccato per la RAM, che non e' aumentata da 80GB della versione precedente. Inoltre se ho ben capito la versione PCIe consuma meno (350W rispetto ai 700W dell'SMX5).

Si conoscono gia' i prezzi delle due versioni?

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^