Torna indietro   Hardware Upgrade Forum > Componenti Hardware > Processori

Tre giorni in Finlandia con OnePlus Watch 2 Nordic Blue. La nostra prova a temperature estreme
Tre giorni in Finlandia con OnePlus Watch 2 Nordic Blue. La nostra prova a temperature estreme
Siamo volati a Helsinki, in Finlandia, per testare a fondo il nuovo OnePlus Watch 2 Nordic Blue Edition. L'orologio ci ha convinti durante i test invernali a Helsinki, grazie al design raffinato, alle prestazioni impeccabili, alla resistenza agli ambienti estremi e all'ottima autonomia garantita dalla modalità intelligente.
Lenovo Factory Tour: siamo entrati nella fabbrica ungherese che produce PC, storage e server
Lenovo Factory Tour: siamo entrati nella fabbrica ungherese che produce PC, storage e server
Edge9 ha visitato lo stabilimento produttivo di Lenovo nei pressi di Budapest in Ungheria, che serve tutta la zona EMEA per i prodotti “business”: PC, storage e server. Un impianto all’avanguardia, con altissimi tassi di efficienza ma anche una grande attenzione alle condizioni lavorative dei dipendenti e alla sostenibilità ambientale
Acer Nitro V 15, alla prova il notebook gaming essenziale con RTX 4050 Laptop
Acer Nitro V 15, alla prova il notebook gaming essenziale con RTX 4050 Laptop
Acer Nitro V 15 è un notebook gaming che punta sul rapporto prezzo-prestazioni per garantire a chi ha un budget intorno o persino inferiore ai 1000€ di giocare abbastanza bene in Full HD grazie alla RTX 4050 Laptop di NVIDIA e la compatibilità con il DLSS 3.
Tutti gli articoli Tutte le news

Vai al Forum
Discussione Chiusa
 
Strumenti
Old 29-06-2016, 22:24   #3941
cdimauro
Senior Member
 
L'Avatar di cdimauro
 
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26107
Per me programmatore, sì: è più facile per sfruttarle per fargli fare compiti più generali.

Ovviamente ciò ha un costo, eh!
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro
@LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro
Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys
cdimauro è offline  
Old 29-06-2016, 22:24   #3942
The_SaN
Senior Member
 
L'Avatar di The_SaN
 
Iscritto dal: Jun 2005
Città: Vitória(ES), Brasile
Messaggi: 8093
Quote:
Originariamente inviato da Free Gordon Guarda i messaggi
Non intendevo quello...ma questo:

http://www.hwupgrade.it/forum/showpo...ostcount=31554

Il tizio nel link, dice che la sua regge 1290mhz con 0,1 in meno del def@1266

AMD si è tenuta molto larga con le tensioni. A questo potrebbe essere dovuto il consumo eccessivo.

Con ste schede stanno facendo cassa, buttano dentro tutti i chip, anche quelli scrausi che non reggono le frequenze target, alzandogli il vgpu..
Questa spiegazione sui consumi eccessivi, mi soddisfa abbastanza.
Cavoli ho postato questa possibilità poco fa sul thread "Aspettando"
__________________
Se la vita ti da limoni ... Spremili in occhio a qualcuno e corri!
The_SaN è offline  
Old 29-06-2016, 22:28   #3943
george_p
Senior Member
 
L'Avatar di george_p
 
Iscritto dal: Sep 2005
Messaggi: 2177
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Per me programmatore, sì: è più facile per sfruttarle per fargli fare compiti più generali.

Ovviamente ciò ha un costo, eh!
Ah ok. Mi viene da pensare che questo faccia parte dei piani HSA di amd e consorzio.
__________________
__________
Configurazione:
Mainboard Gigabyte G1.Sniper A88X (rev. 3.0) ; APU A10 7850K ; HDD Western Digital SATA III  WD Blue 1 TB ; Ram Corsair 1866 mhz 16 gb ; OS Seven premium 64 bit
george_p è offline  
Old 29-06-2016, 22:34   #3944
davo30
Senior Member
 
L'Avatar di davo30
 
Iscritto dal: Jul 2012
Messaggi: 2811
Quote:
Originariamente inviato da george_p Guarda i messaggi
Ma cosa vi aspettavate consumasse 40 w per andare quanto una 390?
Il rapporto di cui scrive Grid invece è riferito alla 470 ed è scritto in una delle slide presentate al computex da amd, come riportato da Mitch di B&C.
Il fatto che molti lo avessero associato alla 480 piuttosto che alla 470 è altra cosa.

Non avrà ancora i consumi delle nvidia amd ma la 480 è stata confrontata con una 970 overcloccata, se non sbaglio pure custom (quindi più efficiente) e decisamente molto più rodata lato drivers, al pari delle precedenti sempre amd.
Senza considerare che queste sono pronte per DX 12 mentre ...altre no.

Solo quando i consumi alti sono di nvidia non frega una fava a nessuno e si guardano altre cose

Intanto però i prezzi sono tutt'altro pianeta
Il problema sono i consumi rispetto alla 1070. Ripeto, non me ne frega una fava, la acquisterò comunque (o la 470, dipende dalle mie finanze tra un mesetto), pero il rapporto tra i consumi della 480 e della 1070 e le prestazioni è abbastanza impietoso.
Speriamo non siano problemi legati al silicio ma all'architettura GCN, altrimenti siamo di fronte all'ennesimo fail di Goffofoundries
__________________
AMD R5 3600 | MSI B450 Tomahawk Max II | 16gb Viper 3000MHz CL17 | AMD XFX RX 5700XT DD 8GB | SSD Patriot 240GB | SSD Kingdian 500GB | Super Flower Amazon 550W | Zalman Z11
davo30 è offline  
Old 29-06-2016, 22:36   #3945
Piedone1113
Senior Member
 
Iscritto dal: Jul 2015
Messaggi: 4711
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
A me ricorda Xeon Phi: massiccia unità vettoriale con annessa unità scalare, ampio register set, cache L1 ed L2, e addirittura istruzioni intere con meno di 32 bit (16 bit), tipiche nei CISC.

La tendenza delle GPU è di diventare sempre più tuttofare. Ecco perché dicevo che sono sempre più simili alle CPU.
Esattamente, ma credo che questo chip andrà in apu (sue evoluzioni in zen+ core) e forse Soc per consolle.
Piedone1113 è offline  
Old 29-06-2016, 22:41   #3946
tuttodigitale
Senior Member
 
Iscritto dal: Sep 2010
Messaggi: 4086
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
La slide riporta che i core Zen siano "6-wide", e dunque abbiano la capacità di eseguire 6 istruzioni per ciclo di clock. Questo cozza con le altre informazioni che circolano, che parlano di core a 4 vie.
ne abbiamo discusso io e bjt2, e siamo arrivati alla conclusione che il 6 wide si riferisca al numero di pipeline integer.

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
La cache L1 è data come 64K + 64K per codice e dati, quindi come i vecchi Athlon/Athlon64, ma questo si discosta dalle altre informazioni che riportano, invece, 32K + 32K
il 32K+32K, è stato teorizzato da dresdenboy poichè ci sono brevetti AMD sulla cache che riportano quelle dimensioni...in quel caso è più attendibile il CERN

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Infine 8MB di cache L3 per 16 core è un valore troppo basso: sarebbero 512KB per core, cioé quanto la cache L2 per core. Considerato che AMD dovrebbe cambiare la gerarchia della cache da esclusiva a inclusiva, la L3 dovrebbe essere più grande della L2 totale per dare un maggior contributo alle prestazioni.
anche perchè con una cache inclusiva non servirebbe a niente...
8MB sono per il modulo, che è composto da 4 core..
il 16 core avrà 32MB di cache l3.
invece non è chiaro ad oggi se l'apu HPC, ma anche quella consumer, avrà o meno la l3...in fin dei conti 512kb di cache l2 per core non sono pochissimi.



Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Quanto a Doom, si sa quanti FPS generava, a che frequenza girava Zen, e la configurazione hardware utilizzata? Altrimenti sapere che ci gira è del tutto inutile
non lo so.

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Per uno step, ce ne vogliono minimo 2, ma si può arrivare tranquillamente anche 3 (non ricordo se si arriva a più di 3), soprattutto coi primi step, che sono decisamente bacati.
considera che è un'architettura nuova che può presentare più di qualche baco...

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Sempre più simili a delle CPU, queste GPU.
soprattutto GCN, e per questo da una parte si pensa che sembrano sempre meno adatte ai giochi...
anche il numero di transistor è molto alto considerando che ci sono la metà di MC e di ROPs, solo 80% di stream processor....5,7 vs 6,2 miliardi...ovvero il 92%....
o c'è qualche CU e ROPs nascosta, o davvero hanno "sprecato" tantissimi transistor per il gpgpu..

EDIT sull'apu HPC da 16 core, oltre ai rumors, anche un progettista di cpu, senza nome (non me lo ricordo) ha teorizzato che sia un puzzle composto da 2 die ZEN e da Polaris...infatti la natura SoC, e il fatto stesso che le HBM2 necessitano dell'interposer rendono poco conveniente, l'approccio monolitico.

Ultima modifica di tuttodigitale : 29-06-2016 alle 22:56.
tuttodigitale è offline  
Old 29-06-2016, 23:01   #3947
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 30309
Quote:
Originariamente inviato da Free Gordon Guarda i messaggi
Non intendevo quello...ma questo:

http://www.hwupgrade.it/forum/showpo...ostcount=31554

Il tizio nel link, dice che la sua regge 1290mhz con 0,1 in meno del def@1266

AMD si è tenuta molto larga con le tensioni. A questo potrebbe essere dovuto il consumo eccessivo.

Con ste schede stanno facendo cassa, buttano dentro tutti i chip, anche quelli scrausi che non reggono le frequenze target, alzandogli il vgpu..
Questa spiegazione sui consumi eccessivi, mi soddisfa abbastanza.
Io non seguo le VGA e quindi non so una mazza di sigle e quant'altro. Ma se ho capito bene, non hanno semplicemente fatto il passaggio sul 14nm non cambiando nulla?
Secondo me ci può stare un leggero overvolt a scapito dei consumi ma a pro del prezzo, in fin dei conti cosi non deve spendere di più nella selezione e comunque il 14nm da margine.
Secondo me AMD tira a fare legna, per me AMD non ha il tempo per affinare silicio, non ha i soldi e ha una gran fretta di mettere in commercio prodotti sia per incassare e sia per dare una base certa e credibile che il 14nm esiste.
__________________
7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Codifica video https://ibb.co/Jm5Zj0M
paolo.oliva2 è offline  
Old 29-06-2016, 23:03   #3948
tuttodigitale
Senior Member
 
Iscritto dal: Sep 2010
Messaggi: 4086
Quote:
Originariamente inviato da Free Gordon Guarda i messaggi
Non intendevo quello...ma questo:

http://www.hwupgrade.it/forum/showpo...ostcount=31554

Il tizio nel link, dice che la sua regge 1290mhz con 0,1 in meno del def@1266

AMD si è tenuta molto larga con le tensioni. A questo potrebbe essere dovuto il consumo eccessivo.

Con ste schede stanno facendo cassa, buttano dentro tutti i chip, anche quelli scrausi che non reggono le frequenze target, alzandogli il vgpu..
Questa spiegazione sui consumi eccessivi, mi soddisfa abbastanza.
avevo letto su altri lidi, che non si poteva occare senza cambiare tensione...d'altra parte anche le slide di AMD mi hanno portato a pensare, che AMD non si sia tenuta larga con le tensioni.

L'importante è che risolvano per Vega.

Quote:
Originariamente inviato da paolo.oliva2 Guarda i messaggi
Secondo me AMD tira a fare legna, per me AMD non ha il tempo per affinare silicio, non ha i soldi e ha una gran fretta di mettere in commercio prodotti sia per incassare e sia per dare una base certa e credibile che il 14nm esiste.
fino a ieri proponeva, nella fascia dei 300 euro in giù, schede del 2011. E considerando che è li dove si fanno i soldi, AMD ha quantomeno cercato di mettere una pezza con prodotti meno costosi da produrre...alla fine è uscito un prodotto con un rapporto prezzo/prestazioni molto buono.

Ultima modifica di tuttodigitale : 29-06-2016 alle 23:09.
tuttodigitale è offline  
Old 29-06-2016, 23:06   #3949
george_p
Senior Member
 
L'Avatar di george_p
 
Iscritto dal: Sep 2005
Messaggi: 2177
Quote:
Originariamente inviato da davo30 Guarda i messaggi
Il problema sono i consumi rispetto alla 1070. Ripeto, non me ne frega una fava, la acquisterò comunque (o la 470, dipende dalle mie finanze tra un mesetto), pero il rapporto tra i consumi della 480 e della 1070 e le prestazioni è abbastanza impietoso.
Speriamo non siano problemi legati al silicio ma all'architettura GCN, altrimenti siamo di fronte all'ennesimo fail di Goffofoundries
Come sarà pietoso per la 1070 con le DX 12
__________________
__________
Configurazione:
Mainboard Gigabyte G1.Sniper A88X (rev. 3.0) ; APU A10 7850K ; HDD Western Digital SATA III  WD Blue 1 TB ; Ram Corsair 1866 mhz 16 gb ; OS Seven premium 64 bit
george_p è offline  
Old 29-06-2016, 23:36   #3950
capitan_crasy
Senior Member
 
L'Avatar di capitan_crasy
 
Iscritto dal: Nov 2003
Messaggi: 24165
Quote:
Originariamente inviato da bjt2 Guarda i messaggi
Visto il FO4 e il Vcore di queste GPU, a me quello che preme è la frequenza a parità di transistors e potenza dissipata e secondariamente il Vcore, per vedere quanto si è tirati... A quale modello TONGA è paragonabile come numero di transistors, o almeno shader? Che potenza? Che frequenza? Che vcore?

Avevamo fatto qualche pagina indietro il conto: a parità di transistors, +20% di frequenza anche a parità di potenza dissipata e -0.05V di Vcore.

Per quanto riguarda Zen, siccome a 28nm non c'è qualcosa di paragonabile a Zen come numero di transistors, si prende o uno XV x4 a 25W e si aggiunge un 20% di frequenza, o un BD (non ricordo l'ultimo sul 28nm, mi pare piledriver) x8 a 45W (se esiste) e si aggiunge il 20% di frequenza...



Per ZEN intendevo un rapporto prezzo/prestazioni/consumo molto simile a Polaris; per le CPU "costose" bisognerà aspettare...
__________________
AMD Ryzen 5600X|Thermalright Macho Rev. B|Gigabyte B550M AORUS PRO-P|2x16GB G.Skill F4-3200C16D-32GIS Aegis @ 3200Mhz|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Silicon Power A60 2TB + 1 SSD Crucial MX500 1TB (Games)|1 HDD SEAGATE IronWolf 2TB|Sapphire【RX6600 PULSE】8GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case In Win 509|Fans By Noctua
capitan_crasy è offline  
Old 29-06-2016, 23:46   #3951
Free Gordon
Senior Member
 
L'Avatar di Free Gordon
 
Iscritto dal: Mar 2004
Città: Eporedia
Messaggi: 13454
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Sempre più simili a delle CPU, queste GPU.
Naaa, solo GCN.

Maxwell (e anche Pascal) sono molto più semplici..
__________________
AMD Ryzen 1700 - Asrock B450 GAMING-ITX/AC - G-Skill RipjawsV 2X8GB 2660mhz - Sapphire Pulse RX 570 ITX - Crucial MX500 m.2 - Corsair Vengeance 500W - Sharkoon Shark Zone C10 Mini ITX
Free Gordon è offline  
Old 29-06-2016, 23:47   #3952
Free Gordon
Senior Member
 
L'Avatar di Free Gordon
 
Iscritto dal: Mar 2004
Città: Eporedia
Messaggi: 13454
Quote:
Originariamente inviato da Piedone1113 Guarda i messaggi
Mi sembra quasi un coprocessore vettoriale. ☺
Credo che Vega sarà strutturaro diversamente più efficiente ma meno tuttofare.
Hmm..purtroppo no. E' da GCN1 che hanno quello schema..

Il problema "grosso" di GCN è proprio quello: è nata per "Fusion" e per le console.
__________________
AMD Ryzen 1700 - Asrock B450 GAMING-ITX/AC - G-Skill RipjawsV 2X8GB 2660mhz - Sapphire Pulse RX 570 ITX - Crucial MX500 m.2 - Corsair Vengeance 500W - Sharkoon Shark Zone C10 Mini ITX
Free Gordon è offline  
Old 29-06-2016, 23:50   #3953
Free Gordon
Senior Member
 
L'Avatar di Free Gordon
 
Iscritto dal: Mar 2004
Città: Eporedia
Messaggi: 13454
Quote:
Originariamente inviato da The_SaN Guarda i messaggi
Cavoli ho postato questa possibilità poco fa sul thread "Aspettando"
Ho visto.
__________________
AMD Ryzen 1700 - Asrock B450 GAMING-ITX/AC - G-Skill RipjawsV 2X8GB 2660mhz - Sapphire Pulse RX 570 ITX - Crucial MX500 m.2 - Corsair Vengeance 500W - Sharkoon Shark Zone C10 Mini ITX
Free Gordon è offline  
Old 29-06-2016, 23:53   #3954
Free Gordon
Senior Member
 
L'Avatar di Free Gordon
 
Iscritto dal: Mar 2004
Città: Eporedia
Messaggi: 13454
Quote:
Originariamente inviato da paolo.oliva2 Guarda i messaggi
Secondo me AMD tira a fare legna, per me AMD non ha il tempo per affinare silicio, non ha i soldi e ha una gran fretta di mettere in commercio prodotti sia per incassare e sia per dare una base certa e credibile che il 14nm esiste.

Con Polaris questo è certo l'obiettivo principale resta da vedere se ci riesce con questo progetto oppure no...

Se riescono a tenere i prezzi sui 250, anche delle custom (una volta assestati), allora ne venderanno a vagonate.
__________________
AMD Ryzen 1700 - Asrock B450 GAMING-ITX/AC - G-Skill RipjawsV 2X8GB 2660mhz - Sapphire Pulse RX 570 ITX - Crucial MX500 m.2 - Corsair Vengeance 500W - Sharkoon Shark Zone C10 Mini ITX
Free Gordon è offline  
Old 30-06-2016, 00:30   #3955
digieffe
Senior Member
 
L'Avatar di digieffe
 
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4053
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Infine 8MB di cache L3 per 16 core è un valore troppo basso: sarebbero 512KB per core, cioé quanto la cache L2 per core. Considerato che AMD dovrebbe cambiare la gerarchia della cache da esclusiva a inclusiva, la L3 dovrebbe essere più grande della L2 totale per dare un maggior contributo alle prestazioni.
la L3 pur essendo delle stesse dimensioni della L2 (quindi essendo inclusiva con lo stesso contenuto) potrebbe servire per "spiare e comunicare" (snooping?) il contenuto delle cache degli altri core lasciando libera la L2
digieffe è offline  
Old 30-06-2016, 06:16   #3956
cdimauro
Senior Member
 
L'Avatar di cdimauro
 
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26107
Quote:
Originariamente inviato da tuttodigitale Guarda i messaggi
ne abbiamo discusso io e bjt2, e siamo arrivati alla conclusione che il 6 wide si riferisca al numero di pipeline integer.
Mah. Non credo che abbiano commesso un errore madornale come quello di contare soltanto le porte per gli interi, peraltro trascurando del tutto quelle FP che sono quelle più interessanti proprio per i tipi di calcoli che si fanno al CERN.

Inoltre in letteratura wide si usa per indicare il numero di istruzioni che sono decodificate e/o eseguite (quindi nemmeno uop: sono istruzioni dell'ISA).

Questa cosa, insomma, mi puzza abbastanza, ma considerato che AMD parla del 40% di IPC in più, potrebbe esserne proprio la chiave di lettura.
Quote:
il 32K+32K, è stato teorizzato da dresdenboy poichè ci sono brevetti AMD sulla cache che riportano quelle dimensioni...in quel caso è più attendibile il CERN
Può essere, perché i brevetti, alla fine, possono riportare degli esempi di utilizzo, ma l'implementazione dell'idea potrebbe benissimo avere "misure" diverse.

Come mai ritieni più attendibile l'informazione del CERN? Perché AMD ritorna al design che l'ha resa celebre, con K7 e K8 aventi ben 64+64 KB di cache L1?
Quote:
anche perchè con una cache inclusiva non servirebbe a niente...
8MB sono per il modulo, che è composto da 4 core..
il 16 core avrà 32MB di cache l3.
Esattamente: è proprio questo che fa storcere il naso. La trovo di poca utilità, anche se c'è da dire che a 14nm quegli 8MB di cache L3 occupano poco spazio rispetto al resto del chip.

D'altra parte mi pare che Apple con l'A9X abbia del tutto rimosso la cache L3, se la memoria non m'inganna, e le prestazioni non sono calate di molto (vista la generosa e veloce cache L2).
Quote:
invece non è chiaro ad oggi se l'apu HPC, ma anche quella consumer, avrà o meno la l3...in fin dei conti 512kb di cache l2 per core non sono pochissimi.
No, ma bisogna vedere com'è fatta la componente GPU integrata: quanta cache L2 ha per i core, e se sono in grado di farcela senza l'appoggio della L3.

Le GPU, lo sappiamo, sono affamatissime di banda, ed è anche il motivo per cui, oltre alla generosa L3, le CPU Intel top di gamma montano 64 o ben 128MB di cache L4 (che però, come la L3, viene usata anche dalla CPU).
Quote:
soprattutto GCN, e per questo da una parte si pensa che sembrano sempre meno adatte ai giochi...
anche il numero di transistor è molto alto considerando che ci sono la metà di MC e di ROPs, solo 80% di stream processor....5,7 vs 6,2 miliardi...ovvero il 92%....
o c'è qualche CU e ROPs nascosta, o davvero hanno "sprecato" tantissimi transistor per il gpgpu..
Propendo per la seconda, ed è una cosa che è davvero strana: è da anni che, IMO, AMD sbaglia a seguire questa strada.

Dovrebbe realizzare core GPU orientati esclusivamente all'elaborazione della grafica, come fa nVidia.

Il GPGPU computing in ambito consumer non ha preso piede, ed è ben lungi dal farlo solo perché AMD presenta GPU con buone capacità in tal senso.

Ha senso soltanto per il settore HPC e per particolari tipologie di server, e dunque in settori molto redditizi dove si può permettere di sviluppare apposite varianti.
Quote:
EDIT sull'apu HPC da 16 core, oltre ai rumors, anche un progettista di cpu, senza nome (non me lo ricordo) ha teorizzato che sia un puzzle composto da 2 die ZEN e da Polaris...infatti la natura SoC, e il fatto stesso che le HBM2 necessitano dell'interposer rendono poco conveniente, l'approccio monolitico.
Quindi ci sarà l'HBM2 integrata? Non so, a questo punto, quanto senso abbia integrare ben 2 die ZEN, quando la parte del leone dovrebbe farla la GPU integrata, che non ha problemi a gestire basse latenze di accesso alla memoria, e bus molto ampi.

Roba che, insomma, non è molto affine ai core di una CPU, che sono pensati per lavorare in maniera quasi diametralmente opposta.

IMO avrebbero fatto meglio a piazzare un piccolo core x86 di controllo/supporto, lasciando la maggior parte del silicio alla GPU.

Mie personalissime riflessioni, come sempre.
Quote:
Originariamente inviato da Free Gordon Guarda i messaggi
Naaa, solo GCN.

Maxwell (e anche Pascal) sono molto più semplici..
In tutta onestà, e come già detto (ma non da ora), fa benissimo così.
Quote:
Originariamente inviato da digieffe Guarda i messaggi
la L3 pur essendo delle stesse dimensioni della L2 (quindi essendo inclusiva con lo stesso contenuto) potrebbe servire per "spiare e comunicare" (snooping?) il contenuto delle cache degli altri core lasciando libera la L2
Il processore ha già logica di bus snooping (o simile) a prescindere, perché rimangono comunque le cache L1 e L2 che devono essere coerenti con quanto presente in memoria o sulle cache degli altri core.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro
@LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro
Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys
cdimauro è offline  
Old 30-06-2016, 07:06   #3957
bjt2
Senior Member
 
L'Avatar di bjt2
 
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6794
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
A me ricorda Xeon Phi: massiccia unità vettoriale con annessa unità scalare, ampio register set, cache L1 ed L2, e addirittura istruzioni intere con meno di 32 bit (16 bit), tipiche nei CISC.

La tendenza delle GPU è di diventare sempre più tuttofare. Ecco perché dicevo che sono sempre più simili alle CPU.
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Per me programmatore, sì: è più facile per sfruttarle per fargli fare compiti più generali.

Ovviamente ciò ha un costo, eh!
Da poco più di 2 anni abbiamo comprato un sistema socket 2011 in un rack 19" con 2 GTX 690 in SLI, viste come 4 GPU. Le usiamo per il GPGPU e mi sono studiato l'architettura. Anche li (e che io sappia anche in architetture precedenti) c'è una unità scalare, mi pare 4 ogni 192. Sono usate anche per le funzioni trascendenti. Il filtro Non Local Mean che abbiamo implementato, usa exp e mi ero fatto il calcolo per vedere se eravamo limitati da quello. Purtroppo siamo limitati dalla banda L1 (neanche da quella RAM) perchè l'algoritmo è abbastanza semplice (ma non troppo semplice da essere limitati dalla banda RAM).

Quote:
Originariamente inviato da capitan_crasy Guarda i messaggi


Per ZEN intendevo un rapporto prezzo/prestazioni/consumo molto simile a Polaris; per le CPU "costose" bisognerà aspettare...
Quindi siamo passati da 190W@970MHz per 2048 shader a 150W@1265MHz per 2304 shader... E c'è chi non è contento? Andiamo bene! Questo fa ben sperare per Zen. +30% di clock, +15% di shaders e -20% di TDP...

Quote:
Originariamente inviato da Free Gordon Guarda i messaggi
Naaa, solo GCN.

Maxwell (e anche Pascal) sono molto più semplici..
Quote:
Originariamente inviato da Free Gordon Guarda i messaggi
Hmm..purtroppo no. E' da GCN1 che hanno quello schema..

Il problema "grosso" di GCN è proprio quello: è nata per "Fusion" e per le console.
Vedi sopra...

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Mah. Non credo che abbiano commesso un errore madornale come quello di contare soltanto le porte per gli interi, peraltro trascurando del tutto quelle FP che sono quelle più interessanti proprio per i tipi di calcoli che si fanno al CERN.

Inoltre in letteratura wide si usa per indicare il numero di istruzioni che sono decodificate e/o eseguite (quindi nemmeno uop: sono istruzioni dell'ISA).

Questa cosa, insomma, mi puzza abbastanza, ma considerato che AMD parla del 40% di IPC in più, potrebbe esserne proprio la chiave di lettura.

Può essere, perché i brevetti, alla fine, possono riportare degli esempi di utilizzo, ma l'implementazione dell'idea potrebbe benissimo avere "misure" diverse.

Come mai ritieni più attendibile l'informazione del CERN? Perché AMD ritorna al design che l'ha resa celebre, con K7 e K8 aventi ben 64+64 KB di cache L1?

Esattamente: è proprio questo che fa storcere il naso. La trovo di poca utilità, anche se c'è da dire che a 14nm quegli 8MB di cache L3 occupano poco spazio rispetto al resto del chip.

D'altra parte mi pare che Apple con l'A9X abbia del tutto rimosso la cache L3, se la memoria non m'inganna, e le prestazioni non sono calate di molto (vista la generosa e veloce cache L2).

No, ma bisogna vedere com'è fatta la componente GPU integrata: quanta cache L2 ha per i core, e se sono in grado di farcela senza l'appoggio della L3.

Le GPU, lo sappiamo, sono affamatissime di banda, ed è anche il motivo per cui, oltre alla generosa L3, le CPU Intel top di gamma montano 64 o ben 128MB di cache L4 (che però, come la L3, viene usata anche dalla CPU).

Propendo per la seconda, ed è una cosa che è davvero strana: è da anni che, IMO, AMD sbaglia a seguire questa strada.

Dovrebbe realizzare core GPU orientati esclusivamente all'elaborazione della grafica, come fa nVidia.

Il GPGPU computing in ambito consumer non ha preso piede, ed è ben lungi dal farlo solo perché AMD presenta GPU con buone capacità in tal senso.

Ha senso soltanto per il settore HPC e per particolari tipologie di server, e dunque in settori molto redditizi dove si può permettere di sviluppare apposite varianti.

Quindi ci sarà l'HBM2 integrata? Non so, a questo punto, quanto senso abbia integrare ben 2 die ZEN, quando la parte del leone dovrebbe farla la GPU integrata, che non ha problemi a gestire basse latenze di accesso alla memoria, e bus molto ampi.

Roba che, insomma, non è molto affine ai core di una CPU, che sono pensati per lavorare in maniera quasi diametralmente opposta.

IMO avrebbero fatto meglio a piazzare un piccolo core x86 di controllo/supporto, lasciando la maggior parte del silicio alla GPU.

Mie personalissime riflessioni, come sempre.

In tutta onestà, e come già detto (ma non da ora), fa benissimo così.

Il processore ha già logica di bus snooping (o simile) a prescindere, perché rimangono comunque le cache L1 e L2 che devono essere coerenti con quanto presente in memoria o sulle cache degli altri core.

Interessante! Se 6 wide vuol dire che ha 6 decoder, è una ottima notizia... Daltronde un modulo XV ne ha 8 per 2 thread, ma 4+4, quindi 6 decoder, magari unificati, per la teoria delle code non è tanto peggio di un 4+4!
__________________
0 A.D. React OS
La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani...
IL MIO PROFILO SOUNDCLOUD! IL MIO CANALE YOUTUBE! IL MIO PLUGIN VST!
bjt2 è offline  
Old 30-06-2016, 07:09   #3958
tuttodigitale
Senior Member
 
Iscritto dal: Sep 2010
Messaggi: 4086
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Mah. Non credo che abbiano commesso un errore madornale come quello di contare soltanto le porte per gli interi, peraltro trascurando del tutto quelle FP che sono quelle più interessanti proprio per i tipi di calcoli che si fanno al CERN.
nelle patch i decoder risultato 4.. in effetti se si riferissero al wide-dispatch sarebbe molto più stretta di quello che siamo pensati a pensare.

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Inoltre in letteratura wide si usa per indicare il numero di istruzioni che sono decodificate e/o eseguite (quindi nemmeno uop: sono istruzioni dell'ISA).
per wide in letteratura si può intendere qualsiasi cosa....per quel che ne sappiamo potrebbe essere un 6 wide-issue OoO e la cosa avrebbe anche il suo senso...

aggiungo un dato: il fattore di scaling dai 28 ai 14nm per le gpu AMD è pari a solo a 1,7x...se questo fosse vero anche per la CPU il die ZEN sarebbe grande 251mmq.

Ultima modifica di tuttodigitale : 30-06-2016 alle 07:28.
tuttodigitale è offline  
Old 30-06-2016, 07:54   #3959
tuttodigitale
Senior Member
 
Iscritto dal: Sep 2010
Messaggi: 4086
Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Come mai ritieni più attendibile l'informazione del CERN? Perché AMD ritorna al design che l'ha resa celebre, con K7 e K8 aventi ben 64+64 KB di cache L1?
No. Perchè c'è la possibilità che il CERN abbia avuto informazioni aggiuntive. Tutto qui.

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Esattamente: è proprio questo che fa storcere il naso. La trovo di poca utilità, anche se c'è da dire che a 14nm quegli 8MB di cache L3 occupano poco spazio rispetto al resto del chip.
non capisco è troppa o troppo poca. Alla fine sono 2MB vs 2,5MB degli XEON Intel...non vedo sta grande differenza.
Se invece ti riferisci alle dimensioni della L2, potrebbe anche essere dovuta ad algoritmi non infallibili per la predizione dei rami, a pensar male..

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Dovrebbe realizzare core GPU orientati esclusivamente all'elaborazione della grafica, come fa nVidia.
auspichi un ritorno al vliw?

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
No, ma bisogna vedere com'è fatta la componente GPU integrata: quanta cache L2 ha per i core, e se sono in grado di farcela senza l'appoggio della L3
l'esperto sei tu, ma non penso che sia così determinante il quantitativo di l2...comunque sono 64-128KB per CU a seconda della GPU. AMD parla di modulo ZEN, quindi sono in parte tentato a pensare che la l3 sarà sempre presente...

Quote:
Originariamente inviato da cdimauro Guarda i messaggi
Quindi ci sarà l'HBM2 integrata?.
pare proprio di si. Anzi credo che il fine ultimo dello sviluppo delle HBM sia proprio il mercato server.

Quote:
Originariamente inviato da digieffe Guarda i messaggi
la L3 pur essendo delle stesse dimensioni della L2 (quindi essendo inclusiva con lo stesso contenuto) potrebbe servire per "spiare e comunicare" (snooping?) il contenuto delle cache degli altri core lasciando libera la L2
di solito è contro indicato avere cache inclusive delle stesse dimensioni, e si usa una victim cache.

ma nel caso di ZEN abbiamo un modulo
4 core
L2 512KB ciascuno (2MB complessivi)
L3 8MB condivisi.

Ultima modifica di tuttodigitale : 30-06-2016 alle 07:57.
tuttodigitale è offline  
Old 30-06-2016, 08:10   #3960
tuttodigitale
Senior Member
 
Iscritto dal: Sep 2010
Messaggi: 4086
Quote:
Originariamente inviato da gridracedriver Guarda i messaggi
si ma non devi migliorare solo te stesso, ma anche rispetto alla concorrenza, quanto meno stare al passo lato efficienza.
in realtà non ha neppure migliorata se stessa...
è riuscita "solo" ad aumentare il clock del 25% senza perdere in efficienza. Un pò troppo poco...vedi la fury
https://tpucdn.com/reviews/AMD/RX_48..._2560_1440.png
tuttodigitale è offline  
 Discussione Chiusa


Tre giorni in Finlandia con OnePlus Watch 2 Nordic Blue. La nostra prova a temperature estreme Tre giorni in Finlandia con OnePlus Watch 2 Nord...
Lenovo Factory Tour: siamo entrati nella fabbrica ungherese che produce PC, storage e server Lenovo Factory Tour: siamo entrati nella fabbric...
Acer Nitro V 15, alla prova il notebook gaming essenziale con RTX 4050 Laptop Acer Nitro V 15, alla prova il notebook gaming e...
Stellar Blade: l'action RPG di Shift Up sfoggia uno stile (quasi) unico su PS5 - Recensione Stellar Blade: l'action RPG di Shift Up sfoggia ...
Recensione Zenfone 11 Ultra: il flagship ASUS ritorna a essere un 'padellone' Recensione Zenfone 11 Ultra: il flagship ASUS ri...
Helldivers 2 ritirato dalla vendita in 1...
Tutte le offerte del weekend sui robot p...
4 friggitrici ad aria sotto i 50€! Una è...
Scontatissimi 2 ASUS TUF con GeForce RTX...
Questa nuova memoria può funziona...
Super sconti realme 12 Pro 5G e realme 1...
Non perdetevelo: DJI Mini 3 (no patentin...
Samsung dirà addio alle GPU AMD p...
PlayStation Plus: a maggio regala EA Spo...
Intel ha ricevuto 30 milioni di euro dal...
Offerte Amazon del Weekend: super prezzi...
I Google Pixel Watch 2 sono crollati a 2...
Creator digitali, c'è un PC LG Gr...
La sindrome da inseguimento ad OpenAI st...
Da non credere: questo TV Nokia UHD da 6...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 19:18.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Served by www2v