Blackwell Ultra în 2025, Vera Rubin în 2026, Rubin Ultra în 2027, Feynman în 2028
Privind înainte: CEO-ul NVIDIA, Jensen Huang, a dezvăluit o gamă robustă de GPU-accelerante A-accelerare la Conferința tehnologică GPU din 2025 a companiei, inclusiv Blackwell Ultra B300, Vera Rubin și Rubin Ultra. Aceste GPU -uri sunt concepute pentru a îmbunătăți performanța AI, în special în sarcinile de inferență și instruire.
Blackwell Ultra B300, stabilit pentru eliberare în a doua jumătate a anului 2025, crește capacitatea de memorie de la 192 GB la 288 GB de HBM3E și oferă un impuls de 50% în calculul tensor FP4 dens în comparație cu Blackwell GB200.
Aceste îmbunătățiri susțin modele AI mai mari și îmbunătățesc performanța de inferență pentru cadre precum Deepseek R1. Într -o configurație completă a rack -ului NVL72, Blackwell Ultra va livra 1,1 exaflops de calcul de inferență FP4 dens, marcând un salt semnificativ asupra configurației actuale Blackwell B200.
Blackwell Ultra B300 nu este doar un GPU autonom. Alături de unitatea Core B300, NVIDIA introduce noi soluții B300 NVL16 Server Rack, stația GB300 DGX și sistemul GB300 NV72L Full Rack.

Combinând opt rafturi NV72L formează superpod -ul complet Blackwell Ultra DGX (ilustrat mai sus), cu 288 CPU -uri GRACE, 576 Blackwell Ultra GPU, 300TB de memorie HBM3E și un impresionant 11.5 Exaflops din puterea de calcul FP4. Aceste sisteme pot fi interconectate pentru a crea supercomputere la scară largă, pe care NVIDIA le numește „fabrici AI”.
Inițial tachinat la Computex 2024, GPU-urile Vera Rubin, următorul gen, se așteaptă să se lanseze în a doua jumătate a 2026, oferind îmbunătățiri substanțiale ale performanței, în special în formarea și inferența AI.

Vera Rubin are zeci de terabyți de memorie și este asociat cu un procesor personalizat de NVIDIA, Vera, care include 88 de nuclee de brațe personalizate cu 176 de fire.
GPU integrează două jetoane pe o singură matriță, obținând 50 de petaflops de performanță de inferență FP4 pe cip. Într -o configurație completă a rack -ului NVL144, Vera Rubin poate livra 3,6 exaflops de calcul de inferență FP4.

Bazându-se pe arhitectura lui Vera Rubin, Rubin Ultra este prevăzută pentru lansare în a doua jumătate a anului 2027. Va utiliza configurația rack-ului NVL576, fiecare GPU prezentând patru matrițe de reticul, livrând 100 de petaflops de precizie FP4 pe cip.
Rubin Ultra promite 15 exaflop -uri de calcul de inferență FP4 și 5 exaflops de performanță de instruire FP8, depășind semnificativ capacitățile lui Vera Rubin. Fiecare Rubin Ultra GPU va include 1TB de memorie HBM4E, contribuind la 365TB de memorie rapidă pe întregul suport.

Nvidia a introdus, de asemenea, o arhitectură GPU de generație următoare, numită „Feynman”, așteptată să debuteze în 2028 alături de CPU Vera. În timp ce detaliile rămân rare, Feynman este anticipat să promoveze în continuare capacitățile de calcul AI ale NVIDIA.
În timpul notei sale cheie, Huang a prezentat viziunea ambițioasă a Nvidia pentru AI, descriind centrele de date drept „fabrici de AI” care produc jetoane procesate de modele AI. El a subliniat, de asemenea, potențialul de „AI fizic” pentru a alimenta roboții umanoizi, folosind platformele software ale NVIDIA pentru a antrena modele AI în medii virtuale pentru aplicații din lumea reală.
Foaia de parcurs a NVIDIA este fericită să poziționeze aceste GPU -uri ca fiind pivotante în viitorul calculului, subliniind necesitatea creșterii puterii de calcul pentru a ține pasul cu avansările AI. Această strategie vine ca Nvidia își propune să -i asigure pe investitori în urma fluctuațiilor recente ale pieței, bazându -se pe succesul jetoanelor sale Blackwell.
