Nebunia AI din China a dus la centrele de date goale și la scăderea închirierilor GPU

URMĂREȘTE-NE
16,065FaniÎmi place
1,142CititoriConectați-vă

Multe dintre centrele de date construite în grabă ale țării nu sunt potrivite pentru sarcini de inferență

Tl; dr: În urma debutului exploziv al lui Chatgpt la sfârșitul anului 2022, industria AI din China a cunoscut o creștere de emoție și investiții. Cu toate acestea, această fervoare inițială a dat loc unei realități îngrozitoare, în timp ce țara se confruntă cu o ofertă excesivă de centre de date subutilizate și schimbarea dinamicii pieței.

Xiao Li, fost contractant imobiliar care a pivotat în infrastructura AI în 2023, a fost martor la această transformare de prima dată prin cererea fluctuantă de GPU -uri Nvidia. Cu un an în urmă, comercianții din rețeaua sa s-au lăudat cu privire la achiziționarea GPU-urilor NVIDIA de înaltă performanță, în ciuda restricțiilor de export din SUA. Multe dintre aceste jetoane au fost înconjurate ilegal în Shenzhen prin canale internaționale. În vârful pieței, un Nvidia H100 – crucial pentru formarea modelelor AI – ar putea aduce până la 200.000 de yuani (28.000 USD) pe piața neagră.

Astăzi, Li a observat că comercianții au devenit mai discreți și prețurile GPU s -au stabilizat. În plus, două proiecte de centru de date cu care este cunoscut se luptă să atragă investiții suplimentare, deoarece susținătorii anticipează randamente slabe. Această tulpină financiară i -a obligat pe liderii proiectului să descarce excesul de GPU -uri. „Toată lumea pare să se vândă, dar nu există mulți cumpărători”, a spus el pentru MIT Technology Review.

Pe scurt, închirierea GPU -urilor către întreprinderile pentru formarea modelului AI – o strategie de bază pentru ultima generație de centre de date – a fost considerată cândva un succes garantat. Cu toate acestea, apariția factorilor economici profunde și schimbători în sectorul AI a pus industria centrului de date din țară pe un teren instabil.

Construcția rapidă a centrelor de date din China, de la Mongolia interioară până la Guangdong, a fost alimentată de o combinație de directive guvernamentale și investiții private. Peste 500 de noi proiecte au fost anunțate în 2023 și 2024, cu cel puțin 150 finalizate până la sfârșitul anului 2024. Cu toate acestea, acest boom al clădirii a dus la o situație paradoxală: o abundență de putere de calcul, în special în China Centrală și de Vest, însoțită de o deficiență de jetoane care satisfac nevoile actuale de inferență și realități regulatoare.

Creșterea Deepseek, o companie care a dezvoltat un model de raționament open-source care se potrivește cu performanța ChatGPT, dar la o fracțiune din cost, a perturbat în continuare piața. Hancheng Cao, profesor asistent la Universitatea Emory, a menționat că această descoperire a schimbat accentul de la dezvoltarea modelului la aplicații practice. „Întrebarea arzătoare a trecut de la„ Cine poate face cel mai bun model de limbă mare? ” pentru „cine le poate folosi mai bine?”

Această schimbare a expus limitările multor centre de date construite în grabă. Multe facilități optimizate pentru instruirea AI la scară largă nu sunt potrivite pentru cerințele cu latență scăzută a sarcinilor de inferență necesare pentru modelele de raționament în timp real. Drept urmare, centrele de date din zone îndepărtate cu energie electrică și terenuri mai ieftine își pierd apelul către companii AI.

Supravegherea puterii de calcul a dus la o scădere dramatică a prețurilor de închiriere a GPU. Un server NVIDIA H100 cu opt GPU -uri acum închiriază pentru 75.000 de yuani pe lună (în jur de 10.345 dolari), în scădere față de maximele anterioare de aproximativ 180.000 de yuani (25.141 dolari). Unii operatori ai centrelor de date au ales să -și părăsească instalațiile inactive, mai degrabă decât să funcționeze în pierdere.

Jimmy Goodrich, consilier tehnologic senior al RAND Corporation, atribuie această situație jucătorilor neexperimentați care au sărit pe bandwagonul AI. „Durerea în creștere a industriei AI a Chinei trece este în mare parte un rezultat al jucătorilor neexperimentați – corporații și administrațiilor locale – sărind pe trenul de hype, construind facilități care nu sunt optime pentru nevoile de astăzi”, explică el.

Sistemul politic al Chinei, cu accentul său pe proiecte economice pe termen scurt pentru avansarea carierei, a jucat un rol semnificativ în boom-ul centrului de date. Oficialii locali, care doresc să-și sporească carierele politice și să stimuleze economia în fața unei crize post-pandemice, s-au îndreptat către infrastructura AI ca un nou motor de creștere.

Această abordare de sus în jos a ignorat adesea cererea reală sau fezabilitatea tehnică. Multe proiecte au fost conduse de directori și investitori cu expertiză limitată în infrastructura AI, ceea ce a dus la instalații construite în grabă, care nu au reușit să fie standarde din industrie.

Creșterea modelelor de raționament precum Deepseek R1 și ChatGPT de la Deepseek a schimbat nevoile de calcul de la instruire pe scară largă la inferență în timp real. Această modificare necesită hardware cu latență scăzută, adesea situată în apropierea unor hub -uri tehnologice majore, pentru a minimiza întârzierile de transmisie și pentru a asigura accesul la personalul calificat.

Drept urmare, multe centre de date construite în China centrală, occidentală și rurală se luptă să atragă clienți. Unii, cum ar fi o instalație recent construită în Zhengzhou, chiar distribuie vouchere de calcul gratuite firmelor tehnologice locale, dar totuși se luptă să găsească utilizatori.

În ciuda provocărilor, guvernul central al Chinei acordă prioritate dezvoltării infrastructurii AI. La începutul anului 2025, a convocat un simpozion al industriei AI subliniind importanța încrederii în sine în această tehnologie.

Marile companii de tehnologie precum Alibaba și Bytedance au anunțat investiții semnificative în cloud computing și infrastructură hardware AI.

Goodrich sugerează că guvernul chinez consideră situația actuală ca o durere în creștere necesară. „Guvernul central chinez va vedea probabil (centre de date subutilizate) ca un rău necesar pentru a dezvolta o capacitate importantă … ei văd sfârșitul, nu mijloacele”, spune el.

Pe măsură ce industria evoluează, cererea rămâne puternică pentru jetoanele NVIDIA, în special modelul H20 conceput pentru piața chineză. Cu toate acestea, pentru mulți din domeniu, cum ar fi managerul de proiect al Centrului de date Fang Cunbao, starea actuală a pieței a determinat o reevaluare.

La începutul anului, Fang a părăsit în întregime industria centrului de date. „Piața este prea haotică. Primii adoptatori au profitat, dar acum sunt doar oameni care urmăresc lacune politice”, explică el. Acum își schimbă atenția către educația AI.

Dominic Botezariu
Dominic Botezariuhttps://www.noobz.ro/
Creator de site și redactor-șef.

Cele mai noi știri

Pe același subiect

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dvs.