Il processore più grande al mondo: 850.000 core per il Wafer Scale Engine 2 di Cerebras

Il processore più grande al mondo: 850.000 core per il Wafer Scale Engine 2 di Cerebras

Wafer Scale Engine 2 (WSE-2) di Cerebras è pronto al debutto: questo processore per calcoli di intelligenza artificiale, grande quanto un wafer di silicio, conta 850.000 core e integra 2.600 miliardi di transistor.

di pubblicata il , alle 11:21 nel canale Processori
Cerebras
 

Anticipato lo scorso agosto, il Wafer Scale Engine 2 (WSE-2) di Cerebras è realtà, in vista di un debutto su più ampia scala nel terzo trimestre: si tratta di un super chip grande quanto un wafer di silicio da 12 pollici, di forma rettangolare, dedicato al mondo dell'intelligenza artificiale e in generale a quello dei supercomputer (HPC).

Cerebras, un'azienda da circa 300 dipendenti dislocati tra Toronto, San Diego, Tokyo e San Francisco, punta a entrare in competizione con le GPU Nvidia e molte altre architetture che affollano il mondo dell'IA. L'obiettivo è rimpiazzare cluster di centinaia o persino migliaia di GPU distribuite su diversi rack di server che usano una potenza di decine di kilowatt, garantendo migliori prestazioni e minori consumi.

Dopo una prima generazione con 400.000 core e 1200 miliardi di transistor prodotti a 16 nanometri da TSMC, WSE-2 passa ai 7 nanometri per offrire 850.000 core e un totale di 2.600 miliardi di transistor su un'area di 46225 mm2. Completano il quadro delle specifiche 40 GB di memoria SRAM con un throughput di 20 petabyte/s e una bandwidth totale dell'interconnessione che collega le tile pari a 220 petabit/s. Quanto al consumo, si parla di 15kW come il predecessore, il che è ottimo considerando le prestazioni raddoppiate: "miracolo" dei 7 nanometri.

  WSE 2 WSE Nvidia A100 Differenze WSE-2 vs A100
Dimensione 46.255 mm2 46.255 mm2 826 mm2 56 volte
Transistor 2.600 miliardi 1.200 miliardi 54,2 miliardi 48 volte
Core 850.000 400.000 7344
(6912 CUDA core + 432 Tensor core)
123 volte
Memoria a bordo 40 gigabyte 18 gigabyte 40 megabyte 1000 volte
Bandwidth memoria 20 petabyte/s 9 petabyte/s 155 gigabyte/s 12.733 volte
Bandwidth interconnessione 220 petabit/s 100 petabit/s 600 gigabyte/s 45.833 volte
Processo produttivo 7 nm 16 nm 7 nm -

Cerebras non ha indicato in modo preciso le frequenze di clock di WSE-2, ma ha spiegato che la prima generazione funzionava tra 2,5 e 3 GHz, e la seconda non vede differenze sotto questo profilo. Interessante, almeno per gli addetti ai lavori, come le rese produttive dichiarate siano pari al 100%. Cerebras ha progettato un sistema grazie al quale può aggirare i difetti produttivi: inizialmente l'azienda aveva allocato un 1,5% di core extra per compensare eventuali difetti di produzione, ma il numero è stato successivamente ridotto grazie alla maturità della tecnologia produttiva di TSMC.

La prima generazione di WSE era venduta all'interno di un sistema completo chiamato CS-1, che ha avuto un buon successo, raccogliendo diverse dozzine di clienti tra cui diversi laboratori di ricerca, aziende farmaceutiche, settore militare, dell'energia e altri ancora. Ad esempio, il Lawrence Livermore ha un CS-1 accoppiato al suo supercomputer Lassen, mentre il Pittsburgh Supercomputer Center ha acquistato due sistemi e li ha collegati al supercomputer Neocortex.

I sistemi di Cerebras sono proposti in un cabinet grande come un rack da 15 unità, che integra networking, raffreddamento a liquido e alimentazione, a un costo che dai 2-3 milioni di dollari del CS-1 dovrebbe salire a "diversi milioni" nel caso del nuovo CS-2.

25 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
nickname8821 Aprile 2021, 11:25 #1
TDP ?
D4N!3L321 Aprile 2021, 11:38 #2
Mi farebbe comodo, mi basta un 850W?
mail9000it21 Aprile 2021, 11:47 #3
Originariamente inviato da: D4N!3L3
Mi farebbe comodo, mi basta un 850W?


>>>>Quanto al consumo, si parla di 15kW come il predecessore
credo di no, ma con una ventina te la cavi.
coschizza21 Aprile 2021, 11:50 #4
Originariamente inviato da: D4N!3L3
Mi farebbe comodo, mi basta un 850W?


non lo dicono direttametne ma il loro sistema completo di tutto con 1 di queste "gpu" viene venduto con il dattaglio di "peak power about 23 kW"
Quindi quel die di tdp avrà almeno una decina di Kw
mtk21 Aprile 2021, 11:55 #5
raffreddamento?cascate del niagara ?
Sp3cialFx21 Aprile 2021, 11:57 #6
Nvidia A100 con 40 megabyte di memoria e il floppy da tre e mezzo
Gringo [ITF]21 Aprile 2021, 11:58 #7
Lo vedo bene con un "Raffreddamento Fiorentina da 3/5cm"...
calabar21 Aprile 2021, 12:03 #8
@Sp3cialFx
Si riferiranno alla memoria integrata nel die, non alla memoria esterna (HBM/GDDR) montata sulla scheda.
demon7721 Aprile 2021, 12:07 #9
Originariamente inviato da: coschizza
non lo dicono direttametne ma il loro sistema completo di tutto con 1 di queste "gpu" viene venduto con il dattaglio di "peak power about 23 kW"
Quindi quel die di tdp avrà almeno una decina di Kw


Originariamente inviato da: mtk
raffreddamento?cascate del niagara ?


Sicuramente c'è un sistema a liquido appositamente realizzato cosiderando pure i consumi decismante importanti.
Del resto è roba che va esclusivamente in cluster per super computer..


PS
Ci gira Crysis (remastered)???
joe4th21 Aprile 2021, 12:10 #10
Visto il nome "Cerebras", gli sviluppatori devono essere fan degli X-Men e del prof. Xavier...

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^