NVIDIA RTX RTX 50 GPUS rulează mai repede decât oricare altul, spune Nvidia
Imaginea de ansamblu: NVIDIA a tras înapoi la AMD cu noi rezultate de referință, prezentând performanța superioară a ultimelor sale GPU -uri care rulează modelele AI Deepseek. Aceasta vine după publicarea recentă a AMD a Benchmarks care și -a poziționat Radeon RX 7900 XTX înaintea ofertelor Nvidia.
Contraatacul Nvidia susține că noul său GPU GeForce RTX 5090 depășește flagship -ul AMD printr -o marjă uluitoare. Potrivit Team Green, RTX 5090 este de 2,2 ori mai rapid decât RX 7900 XTX atunci când rulați modele AI Deepseek R1.
Gigantul tehnologic a efectuat repere extinse folosind trei versiuni ale modelului Deepseek R1 AI: Distill Qwen 7B, Llama 8B și Qwen 32B. Când a utilizat QWEN LLM cu 32B parametri, NVIDIA relatează că RTX 5090 a fost cu 124 la sută mai rapid decât concurentul AMD, în timp ce generația anterioară RTX 4090 a gestionat încă un avantaj de 47 la sută.
Modele similare au apărut în alte teste. Cu Llama 8B, RTX 5090 a depășit RX 7900 XTX cu 106 la sută, în timp ce RTX 4090 a menținut un avantaj de 47 la sută. Chiar și în testul QWEN 7B, cea mai recentă ofertă a NVIDIA a fost cu 103 la sută mai rapidă, RTX 4090 prezentând un avantaj de performanță de 46 la sută.
Aceste rezultate contrastează puternic cu referințele anterioare ale AMD, care au arătat RX 7900 XTX care a depășit RTX 4090 și 4080 RTX 4080 de la NVIDIA, cu oportunități de până la 113 la sută și, respectiv, 134 la sută.
Nvidia a mai susținut că GPU -urile sale GeForce RTX 50 Seria, alimentat cu până la 3.352 trilioane de operațiuni pe secundă a capacității de procesare AI, sunt poziționate în mod unic pentru a conduce familia DeepSeek de modele distilate mai repede decât orice altă opțiune pe piața PC. Acest lucru se datorează faptului că familia modelului R1 Deepseek, pe care Nvidia a descris -o ca parte a unei noi clase de modele de raționament.
Aceste LLM-uri sunt concepute pentru a imita procesele umane de rezolvare a problemelor, alocând mai multe resurse de calcul pentru „gândire” și „reflectarea” pe probleme complexe. Această abordare, cunoscută sub denumirea de scalare în timp de testare, permite modelului să aloce dinamic resurse de calcul în timpul inferenței pentru a raționa prin probleme mai eficient.
Nvidia a menționat, de asemenea, că GPU-urile sale RTX 50, cu nuclee de tensiune dedicate a cincea generație, sunt construite pe aceeași arhitectură GPU Blackwell care conduce inovații AI în centrele de date. Această arhitectură permite RTX să accelereze pe deplin modelele DeepSeek, oferind eficiența maximă a inferenței pe calculatoarele personale.
De asemenea, compania și-a propus platforma RTX AI, un ecosistem care deschide capacități DeepSeek-R1 către peste 100 de milioane de PC-uri NVIDIA RTX AI din întreaga lume, inclusiv cele echipate cu cel mai recent GPU GPU GeForce RTX 50.
NVIDIA a susținut că GPU-urile RTX de înaltă performanță asigură că capacitățile AI rămân accesibile, chiar și fără o conexiune la internet. Aceasta nu numai că oferă o latență scăzută, dar și îmbunătățește confidențialitatea, deoarece utilizatorii pot evita încărcarea materialelor sensibile sau expunerea întrebărilor lor la serviciile online.