La prossima generazione di NVIDIA potrebbe nascondere dei veri e propri mostri. Le specifiche delle GPU NVIDIA Ada Lovelace infatti potrebbero contare su un massimo di 18432 CUDA core capaci di sviluppare una potenza bruta di calcolo pari a 64 TPLOP
Facciamo ancora fatica a reperire le RTX 30 sul mercato, ma già si comincia a parlare di nuova generazione. Probabilmente NVIDIA Ada Lovelace non rappresenterà l’architettura che muoverà le GPU del prossimo anno. Nel 2021 ci aspettiamo di vedere le versioni “SUPER” dell’attuale architettura Ampere, forse realizzata con un processo più raffinato – i candidati sono i 6 nm di Smasung oppure i 7 nm di TSMC utilizzati già da AMD – e quindi con frequenze di clock più elevate. NVIDIA Ada Lovelace molto probabilmente arriverà nel 2022 e, anche se siamo molto lontani dalla commercializzazione, è anche vero che lo sviluppo di chip così complessi come GPU e CPU prende parecchio tempo e quindi è possibile che almeno una parte degli ingegneri NVIDIA sia già al lavoro sulla nuova architettura. Ma vediamo i dettagli sulle specifiche di NVIDIA Ada Lovelace che sono trapelati da poco, diffusi da wccftech.
NVIDIA Ada Lovelace: un nuovo mostro?
La nuova architettura Ada Lovelace che ancora non sappiamo se sarà chiamata NVIDIA Lovelace o NVIDIA Ada – che è il nome del linguaggio di programmazione dedicato alla celebre scienziata Ada Lovelace – è stata protagonista di recenti rumor diffusi soprattutto dal noto leaker @kopite7kimi che era stato un affidabilissima fonte per quanto riguarda i rumor sull’attuale architettura Ampere per altro quasi tutti confermati. NVIDIA Ada Lovelace dovrebbe precedere l’architettura Hooper, la quale secondo rumor passati sarebbe dovuta arrivare dopo Ampere. La roadmap sarebbe poi stata modificata a causa si alcuni ritardi nello sviluppo della tecnologia MCM (Multiple Chip Module). Questa tecnologia permetterebbe di “assemblare” chip di grosse dimensioni, utilizzando dei die più piccoli interconnessi tra loro, un po’ come attualmente avviene per i chiplet delle CPU AMD. Questo permetterebbe di alzare di molto le rese, tuttavia le sfide da vincere in termini di efficienza e capacità di comunicazione non poche.
Ecco perché NVIDIA Ada Lovelace fornirà uno squisito intermezzo, basato su di un gigantesco chip monolitico. La più potente GPU AD102 infatti avrà dimensioni quasi raddoppiate rispetto all’attuale top di gamma GA102, la GPU che muove RTX 3090 ed RTX 3080 per capirci.
GA102 has a "7*6" structure.
Maybe AD102 will get a "12*6" structure.— kopite7kimi (@kopite7kimi) December 28, 2020
Prime specifiche trapelate
Ma non è tutto. Sempre tramite Twitter, i ragazzi del 3DCenter sono riusciti a raccogliere un sacco di dettagli che poi Kopite ha confermato. Le specifiche della GPU NVIDIA Ada Lovelace AD102 sembrano mostrare ben 18432 CUDA core organizzati in 144 SM, circa il 70% in più rispetto ai 10.496 che troviamo nella RTX 3090, il che è coerente con l’aumento di dimensioni del chip. Si tratta di aumento considerevole, quasi quanto il salto che abbiamo visto tra Ampere e Turing. La possibilità di integrare un numero così elevato di core potrebbe essere legata al nuovo processo a 5nm – verosimilmente quello di TSMC, attualmente monopolizzato da Apple per i suoi processori – che potrebbe essere. Assumendo una velocità di clock di 1,75 GHz che solo leggermente superiore alla frequenza di base di una RTX 3090, quindi un valore del tutto plausibile, è anche possibile stimare le prestazioni nella operazioni a precisione singola della NVIDIA Ada Lovelace top di gamma che sono circa 64 TFLOP. Una valore enorme. Supponendo invece un clock di 1.8 GHz si arriva a 66 TFLOP. Quasi il doppio rispetto ad una RTX 3090.
So, nVidia's AD102 chip maybe is like:
12 GPC
72 TPC
144 SM
18'432 FP32 units
~66 TFlops FP32 power (on 1.8 GHz) https://t.co/A8OnUktE1s— 3DCenter.org (@3DCenter_org) December 28, 2020
Ma gli avanzamenti non si limiteranno alla forza bruta. Secondo Kopite l’architettura ADA presenterà una cache L2 molto più grande, la cui taglia non viene aggiornata dai tempi di Turing. Possiamo quindi aspettarci una revisione architetturale profonda e non solamente un aggiornamento del processo di produzione che quindi potrebbe portare ad importanti salti prestazionali come fu il passaggio da Kepler a Pascal. Al momento non è chiaro se NVIDIA utilizzerà il processo 5nm di Samsung o TSMC. Sebbene i rendimenti del colosso coreano siano molto distanti da quelli di TSMC, specialmente nei nodi di processo con tecnologia così avanzata, è anche vero che la fonderia taiwanese deve soddisfare la richiesta di silicio di mezzo mondo e liberare le linee per produrre in volumi elevati non è certamente semplice.
NVIDIA Ada Lovelace: top o flop?
Certamente ancora è troppo presto per trarre delle conclusioni. Mancano tantissime informazioni fondamentali come ad esempio il tipo e quantità di memoria video che verranno utilizzate e l’architettura dei Tensor core e RT core, fondamentali per l’applicazione di tecnologie interessanti come il DLSS e il ray tracing in tempo reale. Infatti già oggi alcuni giochi mettono a dura prova anche le GPU top di gamma quando si chiede di far girare un gioco in 4K con ray tracing attivo (anche se il DLSS è un’ancora di salvezza in questo senso).
Tuttavia possiamo fare alcuni commenti a caldo. NVIDIA Ada Lovelace aumenterà ancora il numero dei core. Sarà la strada corretta? Parlando di forza bruta una AMD RX 6900 XT con i suoi 5.120 stream processor sviluppa circa 23 TFLOP di potenza in operazioni a singola precisione, mentre una RTX 3090 con i suoi 10.406 CUDA core arriva a circa 35 TFLOP. Una numero doppio di core porta ad un incremento del 30% circa delle prestazioni in termini di forza bruta. Quindi le prestazioni non scalano linearmente con il numero dei core. Sarà una buona idea continuare a scalare la quantità di CUDA core? Dipende da come verrà ottimizzato il software in futuro. Attualmente molte applicazioni non sono ottimizzate per processori altamente scalabili. Parallelizzare introduce comunque un overhead perché bisogna “spezzettare” i task, sincronizzarli e poi “assemblare” i risultati. Lo scheduling diventa molto più complesso e quindi meno efficiente. Dipende anche molto dalle applicazioni chiaramente. Tuttavia ad oggi la strategia di AMD potrebbe rivelarsi più logica, il tempo poi ci dirà come si svilupperanno le cose. Dalla sezione hardware è tutto, continuate a seguirci!
Lascia un commento