View Single Post
Old 28-12-2023, 13:40   #116
mikael84
Moderatore
 
L'Avatar di mikael84
 
Iscritto dal: Mar 2007
Messaggi: 20988
Quote:
Originariamente inviato da paolo.oliva2 Guarda i messaggi
Si, ho capito questo... ma la potenza nominale riporta la prestazione nominale... che non rispecchierebbe in toto la prestazione finale, perchè questa è in base all'efficienza (presumo in base all'implementazione e dal software), mentre mi pare che "noi" consideriamo la potenza nominale dando per scontato che rifletta la prestazione finale e quindi se pippo ha 10 e pluto 9,9, pippo è più prestante.

Io credo (e spero) che per l'AI facciano come per le CPU, dei bench dove a parte i TOPS nominali si concretizzi il risultato finale e da qui il confronto.
Quelli riportati sono valori nominali di picco. Le perf effettive in base ai programmi possono cambiare tra microarchitetture diverse. Qua vado OT, e tu di GPU sei poco pratico, ma se prendi una A770 di intel, ha 20tf, quanto quelli di una 6800xt di AMD, e guarda quanto vanno nei bench.
Tuttavia di base, hanno gli stessi valori teorici, sia in virgola mobile che di thread.

Quote:
Originariamente inviato da wulff73 Guarda i messaggi
I tensor di Ada su AD102-103-104 vedo che di picco calcolano tra i 330 ed i 660 tops in INT8....

https://www.time.news/100-faster-tha...kepc-hardware/

Questo giusto per dire che magari ora unità di calcolo AI dedicate sulle CPU sono più che altro scelte spinte dal marketing piuttosto che reali benefici complessivi per il sistema.
Questo perchè quelli di ADA sono a 128 ops non 256 come quelli di hopper, quindi ratio dimezzato, ed in più, non viene specificato il FP8 che raddoppia il picco. Valore che nvidia elenca nella 4090.
Infatti, se apri il link, lui specifica pure il valore FP8, ma su nsight non viene rilevato. In più esiste anche una modalità chiamata sparsity che raddoppia anch'esso il ratio.
https://www.notebookcheck.it/fileadm...ussy_slide.jpg

In sintesi quelli di hopper sono 4 volte più potenti, di cui parte della potenza viene persa per via del clock, 1,8 vs 2,5.

E' OT, ma era giusto per chiarire il picco NPU che interessava.
__________________
Ryzen 5800x3D - Msi B450TH - Corsair 32gb 3600 lpx - RTX 3080 FE - samsung 860 pro 1tb - 4tb storage - Acer g-sync xb270hu - XFX 850 watt - tim 200/20 mbps.

Ultima modifica di mikael84 : 28-12-2023 alle 13:45.
mikael84 è offline   Rispondi citando il messaggio o parte di esso