Scegliere una scheda grafica in base alla referenza

Novembre 2016

I consigli per l'acquisto di una scheda grafica sono dati nell'articolo: Scegliere una scheda grafica per il proprio PC. Qui, cercheremo di capire come i costruttori nominano le diverse schede grafiche, nei limiti del possibile, perché non c'è sempre una logica dietro la cosa, poi cercheremo di comparare da un punto di vista teorico le prestazioni delle schede a seconda della loro struttura interna.

Il componente determinante per una scheda grafica è il processore grafico, GPU in inglese, al quale è associato della memoria per lo stoccaggio dati. Il GPU è composto di Processori di flusso (Stream Processors, SP), che fa i calcoli importanti, delle unità di texturing (TU), che aggiungono le texture per ogni pixel, e dei ROP's (Raster Operators), il trattamento finale sui pixel, incaricato tra l'altro dell'anti aliasing (AA). Più unità di calcolo ci saranno a disposizione del GPU, Stream Processor sopratutto, ma anche Unità di Texturing e ROP's, più sarà potente.

Due costruttori condividono il mercato delle schede grafiche separate: ATI (inglobato dalla AMD ora) e nVidia. Nella gamma per il grande pubblico, le schede nVidia sono tutte chiamate GeForce, e le ATI/AMD si chiamano tutte Radeon e questo, ed è così dal 2000 circa.


Come identificare le prestazioni di una scheda grafica ATI/AMD dalla referenza

Possiamo dire che in casa AMD gli appellativi seguono più o meno un ordine logico, ovvero serie 3000, 4000, 5000 e 6000:

La cifra delle migliaia caratterizza la famiglia del GPU, più è alto, più è recente (ad esempio la serie 6000 è più recente della serie 5000).

Una 4850 è nettamente più potente di una 4650, la cifra più alta delle centinaia indica un GPU superiore.

Una 4850 è un po' meno potente di una 4870 : qui, solo il numero delle decine è cambiato, si tratta dello stesso GPU, con un po' meno calcoli per la HD 4850.

Possiamo comparare schede di generazioni diverse, ma non delle schede la cui reference è completamente diversa: una 4850 è meno potente di una 5850 (una sola cifra di scarto), ma non possiamo dare giudizi a prescindere sulle prestazioni comparate di una 4850 e di una 5770,
la 5770 è più recente (migliaia 5 > 4), ma la cifra delle centinaia è inferiore (7< 8). Bisogna guardare la strutture dei GPU per poter dire di più. Ci sono anche dei casi dove purtroppo questa logica non viene rispettata, come vedremo più in là con le HD 6800.

Come identificare le prestazioni di una scheda grafica nVidia dalla referenza

Anche le referenze nVidia seguono una numerazione in ordine più o meno logico:

GeForce GT/GTS/GT serie da 100 a 500:

La cifra delle centinaia caratterizza la famiglia del GPU, quindi più o meno l'anno di uscita. Ad esempio, una GT 250 è più vecchia di una GT 450. Il prefisso GT/GTS/GTX indica semplicemente una scheda sempre più potente, è ridondante con la numerazione. Le schede dalla serie 400 sono compatibili DX11, la meno potente è la GT 430 e la più potente la GT 580.

La cifra delle decine che aumenta corrisponde a un GPU potente, ma basato teoricamente sulla stessa architettura: ad esempio, la GTX 480 è più potente della GTX 470, sono basate sullo stesso GPU, con delle unità di trattamento disattivate. Ma ci sono delle eccezioni: a GTX 460 non è una GTX 470 con delle unità disattivate, o meno numerose.

Anche nVidia chiama i processori di flusso (Stream Processors, SP) unità di trattamento o CUDA core. Per le serie GT 200, 400 e 500, la potenza della scheda grafica corrisponde alla regola della numerazione. Invece, tra le serie GT 100 o GT 200, impossibile capirci qualcosa: bisogna guardare la struttura interna del processore grafico (GPU). Otteniamo questa tabella comparativa serie 100/200 e GeForce 9000:

Serie 100

G 100* : 8 SPinferiore alla 9400 GT
GT 120* : 32 SP, equivalente alla 9500 GT
GT 130* : 48 SP nel mezzo tra la 9500 GT e la 9600 GT
GTS 150* : 128 SPvicina alla 9800 GTX+

Serie 200
G 210 : 16 SP equivalente alla 9400 GT
GT 220 : 48 SP nel mezzo tra 9500 GT e 9600 GT
GT 230* : 64 SPvicina ala 9600 GT
GT 240 : 96 SP equivalente alla 9600 GSO (9600 GT boostata)
GTS 240* : 112 SP équivalente à une 9800 GT surcadencée
GTS 250 : 128 SP equivalente alla 9800 GTX+


Queste schede sono fornite nei PC di marca, e non disponibili separatamente. Fonte: nVidia.

Comparazione teorica delle schede ATI/AMD tra loro e delle nVidia tra loro

Per avere un'idea più precisa delle prestazioni teoriche di schede dello stesso costruttore, bisogna guardare la struttura del GPU. Possiamo comparare le frequenze del GPU e della memoria, ma ha senso solo per modelli molto vicini tra loro. Infatti, comparare la frequenza GPU di una HD 5850 (725MHz) con una 5870 (850MHz) a un senso, perché le due schede sono basate sullo stesso GPU, con un numero diverso di processori flusso, ma non ha alcun senso tra una HD 5850 e una HD 6950 (800Mhz), perché la struttura del GPU è nettamente diversa.

AMD

Come citato precedentemente la logica non è presente per le HD 6800: ad esempio, tra la HD 5850 e la HD 6850, comparando le migliaia si intuisce che la HD 6850 è più recente, e questo è vero. Ma la logica si ferma qua: le centinaia dovrebbero significare che la HD 6850 è superiore alla HD 5850, ma non lo è.

Bisogna guardare le unità interne del GPU per capire: HD 5850 -> SP 288 vec5, spesso contabilizzati 1440 (288x5), 72 unità texturing e 32 unità Raster (ROP's). HD 6850 -> SP 192 vec5 contati 960 (192x5), 48 unità di texturing e 32 unità Raster (ROP's).

Qui, si può facilmente constatare una quantità di processori di flusso e di unità di texturing sulla HD 5850. L'ottimizzazione del trattamento della tassellazione e le frequenze più alte sulla HD 6850 permettono di ridurre la distanza, dopo la numerazione. Otteniamo la stessa cosa con le HD 5870 e HD 6870, è la prima ad essere più potente, anche se la numerazione lascia pensare il contrario.

Per l'ultima generazione di schede grafiche AMD, le HD 79XX, l'architettura "Graphics Core Next" è ancora diversa: dalla serie 5000 delle Radeon HD, AMD propone un modello di architettura basato sul VLIW o Very Large Instruction Word. In breve, tutte le unità del chip eseguono molte operazioni simultaneamente in un colpo solo (a seconda dell'encoding): possiamo definirlo un comportamento vettoriale.

Con le Graphics Core Next, AMD cambia tutto e propone un'architettura che comprende un'unità vettoriale + co-processore scalare, associato a un scheduler/planner per eseguire le task: si tratta di lavorare di un solo comando per blocco, sempre su diversi elementi contemporaneamente. Abbiamo quindi di una frammentazione del chip o le unità di calcolo, chiamate anche CU o Computer Unit, sono costituite da blocchi SIMD (quattro per CU), dove ognuno di essi può eseguire un comando per un massimo di 16 elementi.

nVidia:

Per nVidia invece, la logica della numerazione corrisponde a realtà, ma alcune possono ingannare.
Ad esempio se compariamo una GT 460 768Mb con una GT 460 1 GB: potremmo pensare che si tratti dello stesso modello di scheda grafica, con poca differenza di memoria dedicata. Ma se andiamo a guardare le loro architetture, troviamo delle differenze. Le due GPU hanno 336 SP e 56 unità texturing, ma la versione 1Gb possiede 32 unità ROP's, mentre la versione 768 MB ne ha 24, e la larghezza del bus è più grande (256 bit contro 192) sulla versione 1 GB:

I ROP's intervengono per il filtering, la versione 1 GB è più adatta a quelli che giocano usando l'A-A (anti-aliasing).

La larghezza del bus interviene sulla velocità degli scambi tra memoria e GPU, quindi la versione 1 GB è un po' più veloce. Sono queste due caratteristiche "nascoste" che fanno la differenza nelle performance delle due schede, e non la differenza di memoria, che è una differenza non così importante.

L'interesse di analizzare la struttura interna è di vedere come è costruito il GPU, non ci fa capire tutto:
l'esempio del migliore trattamento della tassellazione sulla serie HD 6800 non appare più sulla struttura interna del GPU. Allo stesso modo, le capacità di trattamento GPGPU delle HD 5800 (assente sulle HD 6800) non compare più: bisognerà quindi fidarsi delle informazioni commerciali o dei test indipendenti.

Comparazione teorica delle schede ATI/AMD e Nvidia tra loro

Per comparare le prestazioni di una scheda grafica iNvidia e di una AMD, è molto più complicato. Possiamo provare, come fatto prima, a comparare il numero di processori di flusso, di unità texturing e di ROP's, ma l'architettura assai diversa dei GPU di nVidia e AMD, che riguardano i processori di flusso, obbliga ad entrare un po' più nel dettaglio della questione, e ci troviamo presto davanti a un vicolo cieco.

Infatti, dalle 8800 di prima versione, nVidia propone un'architettura chiamata SIMT (Single Instruction, Multiple Data), dove un comando di più operazioni è applicato ad un elemento.
Tecnicamente, che si tratti di architettura SIMT o SIMD, i chip sono in tutti i casi dotati di unità scalari. In teoria, il SIMT dovrebbe essere più efficace, il programma non si deve preoccupare del riempimento di unità vettoriale, che non è il caso del SIMD.

Anche se i chip dell'AMD e di nVidia propongono tutti e due delle architetture grafiche unificate, l'architettura SIMT o SIMD inducono una contabilizzazione difersa dei processori di flusso, dato che sulle AMD ogni processore di flusso può contenere fino a 5 comandi (4 sulle HD 69XX). E quindi comparare semplicemente bruta del numero di unità per il trattamento vettoriale non permette di estimare la potenza di un chip rispetto a un'altro. Tutta la difficoltà sta nel capire quante unità di trattamento vettoriale sono utilizzate simultaneamente, perché dipenderà dalle istruzioni, e quindi dall'encoding dei giochi. Con l'ultima architettura AMD, il Graphixs Core Next, è allo stesso modo complicato, dato che nonostante un aspetto scalare dal punto di vista dei programmatori, ci sono sempre unità vettoriali.

È quindi senza benchmark sui quali basarsi, comparare schede nVidia e AMD praticamente una missione impossibile. Proviamo comunque a comparare secondo la struttura del GPU la GTX 580 e la HD 7950, che secondo i bench di gioco danno risultati molto vicini.

La GTX 580 è composta da:

4GPS (Grafics Processing Cluster). Ogni cluster dispone a sua volta di 4 SM (Streaming Multiprocessor). Ogni SM racchiude 32 nodi di esecuzione CUDA, che fa in totale 512 processori di flusso, elementi che lavorano simultaneamente;

L'analisi della HD 7950 da 28 CU (Compute Unit) ognuno dotato di 4 SIMD, ognuno può lavorare su 16 elementi, che in totale sono 1792 processori di flusso.

Come spiegare una tale differenza sui processori di flusso, quando i risultati in game sono vicini?
I processori di flusso non lavorano tutti insieme sulla AMD, per la presenza di unità vettoriali. Dato che la GTX 580 con 512 Stream Processors (SP) da dei risultati vicini in game, possiamo quindi concludere provvisoriamente che la HD 7950 fa lavorare in simultanea solo da 500 a 600 SP, per un rendimento da 3 a 4 volte inferiore al GPU della nVidia.

Schede grafiche per laptop

In generale le schede grafiche dei laptop si identificano col suffisso M (mobile), però sono molto meno potenti di quelle con la stessa referenza dei PC fissi. Ad esempio una GTX 770M non niente da spartire con la GTX 770, corrisponde piuttosto ad una GTX 750 Ti per fissi. Inoltre, alcune referenze molto recenti corrispondono a schede molto poco potenti, non avendo alcun interesse nei confronti di un chip grafico integrato nella CPU, consumando solo di più. Ad esempio non si trae vantaggio dalla GeForce 820M come scheda grafica dedicata, dato che non è meglio del chip CPU Intel HD Graphics 4600 in quanto a performance.

Per quanto riguarda la logica della numerazione, non siamo messi meglio delle schede grafiche per PC desktop. Anzi è peggio, alcune referenze corrispondono a due prodotti diversi. Ad esempio la GTX 860M può corrispondere ad una scheda con architettura Maxwell, con 640 unità di calcolo, consumando poco (TDP= 40 W), o ad una vecchia scheda con architettura Kepler, che consuma molto di più (TDP= 75 W), con 1152 unità di calcolo, vedi nVidia GeForce-GTX.

Anche se la scheda Kepler è poco potente, consumare quasi il doppio su un laptop può fare la differenza in termini di autonomia. Bisogna quindi leggere attentamente nel dettaglio le informazioni tecniche prima di tirare fuori il portafoglio, tra l'altro cambiare scheda grafica su un laptop è impossibile nel 99% dei casi.

Conclusione

Per riassumere, l'analisi della struttura del GPU permette di analizzare a fondo la previsione delle prestazioni delle schede, con meno precisione dei test pratici, che restano comunque di riferimento.
Se questo metodo dà buoni risultati tra schede della stessa marca, è limitato comparando schede grafiche dei due produttori: la struttura molto diversa dei GPU rende molto difficile, se non impossibile, la comparazione puramente teorica delle unità di calcolo.

Potrebbe anche interessarti :
Il documento intitolato « Scegliere una scheda grafica in base alla referenza » da CCM (it.ccm.net) è reso disponibile sotto i termini della licenza Creative Commons. È possibile copiare, modificare delle copie di questa pagina, nelle condizioni previste dalla licenza, finché questa nota appaia chiaramente.