DeepSeek din China lansează un model de IA care depășește App Store, rivalizând cu OpenAI cu mai puține resurse

URMĂREȘTE-NE
16,065FaniÎmi place
1,142CititoriConectați-vă

Startup-ul chinezesc AI obține un succes de referință în ciuda sancțiunilor americane cu cipuri

Ce tocmai sa întâmplat? Compania chineză de inteligență artificială DeepSeek a lansat o versiune deschisă a modelului său de raționament, R1, pe 20 ianuarie 2025. Modelul a atras multă atenție în industria tehnologică pentru performanța sa, care se pare că se potrivește sau depășește o1 a OpenAI pe anumite criterii de referință AI. De la lansare, conversațiile pe rețelele de socializare au fost rapide și furioase cu privire la impactul său potențial asupra dezvoltării AI și a concurenței dintre companiile tehnologice chineze și americane.

Proeminentul capitalist de risc Marc Andreessen a fost unul dintre cei impresionați de ispravă, scriind pe X că modelul lui DeepSeek a fost „una dintre cele mai uimitoare și impresionante descoperiri pe care le-am văzut vreodată”.

Realizarea DeepSeek este deosebit de remarcabilă, având în vedere pretenția companiei că a antrenat un model cu 671 de miliarde de parametri folosind doar 2.048 de Nvidia H800 și 5,6 milioane de dolari, o fracțiune din resursele cerute de obicei de giganții din industrie precum OpenAI și Google. Această rentabilitate este și mai remarcabilă având în vedere sancțiunile SUA care restricționează vânzarea de cipuri avansate către companiile chineze.

Comentatorii au spus că, din aceste motive, modelul are și implicații geopolitice. „Performanța impresionantă a modelelor distilate de la DeepSeek (…) înseamnă că raționanții foarte capabili vor continua să prolifereze pe scară largă și să fie rulați pe hardware local, departe de ochii oricărui regim de control de sus în jos”, Dean Ball, cercetător AI la Universitatea George Mason, a scris.

Unii observatori cred că succesul DeepSeek ar putea beneficia întreaga industrie AI. „Dacă modelele de antrenament se ieftinesc mai repede și mai ușor, cererea de inferență (utilizarea reală a inteligenței artificiale în lumea reală) va crește și se va accelera și mai repede, ceea ce asigură că va fi utilizată oferta de calcul”, a scris Garry Tan, CEO al Y Combinator. X.

Cu toate acestea, nu toate reacțiile au fost uniform pozitive. Neal Khosla, CEO al Curai, și-a exprimat scepticismul, sugerând că compania ar putea fi un „psic de stat ccp” menit să submineze competitivitatea IA din SUA. Cu toate acestea, această afirmație a fost contestată din lipsă de probe.

DeepSeek-R1 este un model de raționament care folosește o abordare pas cu pas a rezolvării problemelor, făcându-l deosebit de expert în sarcini din fizică, știință și matematică. Modelul conține 671 de miliarde de parametri, care contribuie la capacitățile sale de rezolvare a problemelor.

DeepSeek a lansat, de asemenea, versiuni mai mici „distilate” de R1, variind de la 1,5 miliarde până la 70 de miliarde de parametri, cea mai mică capabilă să ruleze pe un laptop.

R1 este disponibil sub o licență MIT, permițând utilizarea comercială fără restricții. Potrivit DeepSeek, modelul depășește o performanță OpenAI pe benchmark-uri precum AIME, MATH-500 și SWE-bench Verified. Acestea evaluează diverse aspecte ale performanței AI, inclusiv sarcinile de rezolvare a problemelor matematice și de programare.

O limitare notabilă a R1 este respectarea cerințelor de reglementare chineze. Ca model chinezesc, este supus unei analize comparative de către autoritatea de reglementare a internetului din China pentru a asigura conformitatea cu „valorile socialiste de bază”. În consecință, R1 se abține să răspundă la întrebări despre subiecte sensibile precum Piața Tiananmen sau autonomia Taiwanului.

În ciuda acestor constrângeri, realizarea DeepSeek a stârnit un interes semnificativ. Începând de duminică după-amiază, asistentul AI al DeepSeek a devenit cea mai bună aplicație gratuită din Apple App Store, depășind chiar și ChatGPT.

Succesul DeepSeek l-a catapultat pe creatorul său Liang Wenfeng în lumina reflectoarelor naționale. Recent, el a fost singurul reprezentant al industriei AI invitat la o întâlnire de mare profil cu Li Qiang, premierul Chinei și al doilea cel mai puternic lider.

Liang, un antreprenor chinez și manager de fonduri speculative, și-a început călătoria către proeminența inteligenței artificiale în lumea finanțelor cantitative. În 2015, Liang a fondat High-Flyer, un fond de acoperire cantitativ care a devenit rapid unul dintre fondurile private cantitative „Big Four” ale Chinei. Sub conducerea lui Liang, High-Flyer a fost pionier în integrarea strategiilor bazate pe inteligență artificială în investițiile cantitative, trecând la o abordare complet bazată pe inteligență artificială până în 2017.

Incursiunea lui Liang în dezvoltarea AI a început serios în 2021, când a început să achiziționeze mii de GPU-uri Nvidia pentru ceea ce a fost perceput inițial ca un proiect secundar excentric. Această mișcare prevăzătoare a pus bazele pentru DeepSeek, pe care Liang l-a fondat în 2023 cu scopul ambițios de a dezvolta IA la nivel uman.

Contextul neconvențional al lui Liang s-a dovedit a fi un avantaj unic în domeniul AI. Experiența echipei sale în utilizarea cipurilor Nvidia pentru tranzacționarea acțiunilor s-a tradus bine în provocările impuse de restricțiile de export ale SUA asupra cipurilor AI avansate în China. Această adaptabilitate a permis DeepSeek să inoveze în fața accesului limitat la hardware de ultimă generație.

Dominic Botezariu
Dominic Botezariuhttps://www.noobz.ro/
Creator de site și redactor-șef.

Cele mai noi știri

Pe același subiect

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dvs.