Il processore più grande al mondo: 850.000 core per il Wafer Scale Engine 2 di Cerebras

Wafer Scale Engine 2 (WSE-2) di Cerebras è pronto al debutto: questo processore per calcoli di intelligenza artificiale, grande quanto un wafer di silicio, conta 850.000 core e integra 2.600 miliardi di transistor.
di Manolo De Agostini pubblicata il 21 Aprile 2021, alle 11:21 nel canale ProcessoriCerebras
Anticipato lo scorso agosto, il Wafer Scale Engine 2 (WSE-2) di Cerebras è realtà, in vista di un debutto su più ampia scala nel terzo trimestre: si tratta di un super chip grande quanto un wafer di silicio da 12 pollici, di forma rettangolare, dedicato al mondo dell'intelligenza artificiale e in generale a quello dei supercomputer (HPC).
Cerebras, un'azienda da circa 300 dipendenti dislocati tra Toronto, San Diego, Tokyo e San Francisco, punta a entrare in competizione con le GPU Nvidia e molte altre architetture che affollano il mondo dell'IA. L'obiettivo è rimpiazzare cluster di centinaia o persino migliaia di GPU distribuite su diversi rack di server che usano una potenza di decine di kilowatt, garantendo migliori prestazioni e minori consumi.
Dopo una prima generazione con 400.000 core e 1200 miliardi di transistor prodotti a 16 nanometri da TSMC, WSE-2 passa ai 7 nanometri per offrire 850.000 core e un totale di 2.600 miliardi di transistor su un'area di 46225 mm2. Completano il quadro delle specifiche 40 GB di memoria SRAM con un throughput di 20 petabyte/s e una bandwidth totale dell'interconnessione che collega le tile pari a 220 petabit/s. Quanto al consumo, si parla di 15kW come il predecessore, il che è ottimo considerando le prestazioni raddoppiate: "miracolo" dei 7 nanometri.
WSE 2 | WSE | Nvidia A100 | Differenze WSE-2 vs A100 | |
Dimensione | 46.255 mm2 | 46.255 mm2 | 826 mm2 | 56 volte |
Transistor | 2.600 miliardi | 1.200 miliardi | 54,2 miliardi | 48 volte |
Core | 850.000 | 400.000 | 7344 (6912 CUDA core + 432 Tensor core) |
123 volte |
Memoria a bordo | 40 gigabyte | 18 gigabyte | 40 megabyte | 1000 volte |
Bandwidth memoria | 20 petabyte/s | 9 petabyte/s | 155 gigabyte/s | 12.733 volte |
Bandwidth interconnessione | 220 petabit/s | 100 petabit/s | 600 gigabyte/s | 45.833 volte |
Processo produttivo | 7 nm | 16 nm | 7 nm | - |
Cerebras non ha indicato in modo preciso le frequenze di clock di WSE-2, ma ha spiegato che la prima generazione funzionava tra 2,5 e 3 GHz, e la seconda non vede differenze sotto questo profilo. Interessante, almeno per gli addetti ai lavori, come le rese produttive dichiarate siano pari al 100%. Cerebras ha progettato un sistema grazie al quale può aggirare i difetti produttivi: inizialmente l'azienda aveva allocato un 1,5% di core extra per compensare eventuali difetti di produzione, ma il numero è stato successivamente ridotto grazie alla maturità della tecnologia produttiva di TSMC.
La prima generazione di WSE era venduta all'interno di un sistema completo chiamato CS-1, che ha avuto un buon successo, raccogliendo diverse dozzine di clienti tra cui diversi laboratori di ricerca, aziende farmaceutiche, settore militare, dell'energia e altri ancora. Ad esempio, il Lawrence Livermore ha un CS-1 accoppiato al suo supercomputer Lassen, mentre il Pittsburgh Supercomputer Center ha acquistato due sistemi e li ha collegati al supercomputer Neocortex.
I sistemi di Cerebras sono proposti in un cabinet grande come un rack da 15 unità, che integra networking, raffreddamento a liquido e alimentazione, a un costo che dai 2-3 milioni di dollari del CS-1 dovrebbe salire a "diversi milioni" nel caso del nuovo CS-2.
25 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info>>>>Quanto al consumo, si parla di 15kW come il predecessore
credo di no, ma con una ventina te la cavi.
non lo dicono direttametne ma il loro sistema completo di tutto con 1 di queste "gpu" viene venduto con il dattaglio di "peak power about 23 kW"
Quindi quel die di tdp avrà almeno una decina di Kw
Si riferiranno alla memoria integrata nel die, non alla memoria esterna (HBM/GDDR) montata sulla scheda.
Quindi quel die di tdp avrà almeno una decina di Kw
Sicuramente c'è un sistema a liquido appositamente realizzato cosiderando pure i consumi decismante importanti.
Del resto è roba che va esclusivamente in cluster per super computer..
PS
Ci gira Crysis (remastered)???
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".