Rack-urile AI răcite de lichid Nvidia promit 25x energie și eficiență de apă de 300x

URMĂREȘTE-NE
16,065FaniÎmi place
1,142CititoriConectați-vă

Răcirea lichidă directă la cip își propune să stabilească o nouă bară pentru sustenabilitatea centrelor de date

Imaginea de ansamblu: Deoarece inteligența artificială și calculul de înaltă performanță continuă să impulsioneze cererea pentru centre de date din ce în ce mai puternice, industria se confruntă cu o provocare din ce în ce mai mare: cum să răciți rafturi din ce în ce mai denumite de servere fără a consuma cantități nesustenabile de energie și apă. Sistemele tradiționale de răcire bazate pe aer, cândva adecvate pentru generațiile anterioare de hardware server, sunt acum împinse la limitele lor de producția termică intensă a infrastructurii AI moderne.

Nicăieri nu este mai evidentă această schimbare decât în ​​cele mai recente oferte ale Nvidia. Sistemele GB200 NVL72 și GB300 NVL72 GB200 NVL72 și GB300 NVL72 reprezintă un salt semnificativ în densitatea de calcul, ambalând zeci de GPU și procesoare în fiecare suport pentru a răspunde cerințelor de performanță ale modelelor AI cu parametru de trilioane și sarcini de inferență pe scară largă.

Dar acest nivel de performanță are un cost abrupt. În timp ce un suport tipic de centru de date consumă între șapte și 20 de kilowati (cu rafturi GPU de înaltă calitate în medie de 40 până la 60 kilowati), noile sisteme ale NVIDIA necesită între 120 și 140 kilowati pe raft. Aceasta este de mai mult de șapte ori mai mare decât puterea setărilor convenționale.

Această creștere dramatică a densității puterii a făcut ca metodele tradiționale de răcire bazate pe aer să fie inadecvate pentru astfel de grupuri de înaltă performanță. Aerul pur și simplu nu poate îndepărta căldura suficient de rapid pentru a preveni supraîncălzirea, mai ales că rafturile cresc din ce în ce mai compacte.

Pentru a aborda acest lucru, NVIDIA a adoptat răcirea lichidă directă la cip-un sistem care circulă lichidul de răcire prin plăci reci montate direct pe cele mai tari componente, cum ar fi GPU și procesoare. Această abordare transferă căldura mult mai eficient decât aerul, permițând configurații mai dens și mai puternice.

Spre deosebire de răcirea tradițională evaporativă, care consumă volume mari de apă pentru a răci aerul sau apa circulată printr-un centru de date, abordarea Nvidia folosește un sistem lichid cu buclă închisă. În această configurație, lichidul de răcire circulă continuu prin sistem fără a se evapora, eliminând practic pierderea de apă și îmbunătățirea semnificativă a eficienței apei.

Potrivit NVIDIA, proiectarea sa de răcire a lichidului este de până la 25 de ori mai eficientă din punct de vedere energetic și de 300 de ori mai eficientă în apă decât metodele de răcire convenționale – o cerere cu implicații substanțiale atât pentru costurile operaționale, cât și pentru sustenabilitatea mediului.

Arhitectura din spatele acestor sisteme este sofisticată. Căldura absorbită de lichid de răcire este transferată prin schimbătoare de căldură lichid-la-lichid la nivel de raft-cunoscute sub numele de unități de distribuție a lichidului de răcire-către infrastructura mai largă de răcire a instalației.

Aceste CDU-uri, dezvoltate de parteneri precum Coolit și Motivair, pot gestiona până la două megawati de capacitate de răcire, susținând imensele sarcini termice produse de rafturi de înaltă densitate. În plus, răcirea cu apă caldă reduce dependența de răcitoare mecanice, scăzând în continuare atât consumul de energie, cât și consumul de apă.

Cu toate acestea, tranziția la răcirea directă a lichidului prezintă provocări. Centrele de date sunt construite în mod tradițional având în vedere modularitatea și serviciile de serviciu, folosind componente care se pot opri la cald pentru întreținere rapidă. Sistemele de răcire lichide complet sigilate complică acest model ca ruperea unui sigiliu ermetic pentru a înlocui un server sau GPU riscă să compromită întreaga buclă.

Pentru a atenua aceste riscuri, sistemele directe la cip folosesc accesorii cu disnectare rapidă cu garnituri fără picături, echilibrând serviciul cu prevenirea scurgerilor. Totuși, implementarea răcirii lichide la scară necesită adesea o reproiectare substanțială a infrastructurii fizice a unei instalații, cerând o investiție semnificativă în avans.

În ciuda acestor obstacole, câștigurile de performanță oferite de sistemele bazate pe Blackwell ale Nvidia sunt operatorii convingători să avanseze cu reamenajare de răcire lichidă. NVIDIA s-a asociat cu Schneider Electric pentru a dezvolta arhitecturi de referință care accelerează implementarea de clustere cu densitate ridicată, răcită cu lichid. Aceste modele, cu CDU -uri integrate și management termic avansat, susțin până la 132 kilowati pe raft.

Dominic Botezariu
Dominic Botezariuhttps://www.noobz.ro/
Creator de site și redactor-șef.

Cele mai noi știri

Pe același subiect

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dvs.