OpenAI lansează modele AI „o1”, promițând raționament la nivel de doctorat în știință și matematică

Compania este atât de încrezătoare în abilitățile lui o1 încât a resetat numărul versiunii înapoi la 1

Pe scurt: OpenAI a dezvăluit o nouă serie de modele de limbaj AI numită „o1”, concepute special pentru a îmbunătăți capacitățile de raționament, în special pentru probleme complexe din știință, codificare și matematică. Compania este atât de încrezătoare în aceste progrese încât a resetat contorul versiunii de model la 1, începând din nou după GPT-4o și s-a îndepărtat în mod semnificativ de brandingul GPT.

Primul model din seria „o1”, numit „o1-preview”, este disponibil atât în ChatGPT, cât și în API-ul OpenAI. În ciuda statutului său de previzualizare, compania promite că actualizări regulate și îmbunătățiri fac parte din plan.

Modelele „o1” au fost instruite pentru a-și îmbunătăți abordarea de rezolvare a problemelor, petrecând mai mult timp analizând problemele înainte de a oferi un răspuns. Această metodă permite modelelor să experimenteze cu diverse strategii, să-și identifice propriile erori și să abordeze sarcini complexe într-un mod mai sistematic, asemănător uman.

Rezultatele împărtășite de OpenAI sugerează un progres semnificativ cu noile modele „o1”. Potrivit companiei, aceste modele performează la un nivel comparabil cu studenții de doctorat în repere provocatoare în domenii precum fizica, chimia și biologia.

De exemplu, a obținut o rată de precizie de 83% la un test care i-a calificat pe elevi pentru Olimpiada Internațională de Matematică, o îmbunătățire notabilă față de precizia de 13% a GPT-4o.

Desigur, benchmark-urile AI pot fi uneori nesigure, astfel încât adevărata performanță a modelelor „o1” va deveni mai clară pe măsură ce mai mulți utilizatori le testează în diferite scenarii.

În plus, noile modele par să rezolve unele întrebări de lungă durată, cum ar fi numărul de R din „căpșuni”, punând în sfârșit meme-ul la loc. OpenAI a prezentat, de asemenea, o demonstrație în care modelul a generat cu succes cod Python pentru un joc arcade, evidențiind capacitățile sale avansate.

OpenAI o1 răspunde la o întrebare renumită dificilă pentru modelele mari de limbaj. pic.twitter.com/5ZlQIOBWEd

– OpenAI (@OpenAI) 12 septembrie 2024

S-a raportat anterior că OpenAI lucrează la un proiect cu numele de cod „Strawberry” pentru a dezvolta modele capabile să abordeze sarcini complexe de raționament. Având în vedere că seria „o1” pare a fi rezultatul proiectului Strawberry, este amuzant să ne gândim că numele proiectului ar fi putut fi inspirat din testul „căpșuni”.

Pe lângă îmbunătățirea capacităților de raționament, OpenAI s-a concentrat și pe consolidarea apărării împotriva „jailbreaking-ului”, o tehnică folosită pentru a ocoli mecanismele de siguranță. Potrivit companiei, „o1-preview” a obținut 84 din 100 la unul dintre cele mai dificile teste de jailbreaking, comparativ cu doar 22 pentru GPT-4o.

Pentru a face aceste modele mai accesibile, în special pentru dezvoltatori, OpenAI lansează și o versiune mai ușoară „o1-mini” concepută pentru sarcini de codare.

Accesul atât la „o1-mini”, cât și la „o1-preview” este acum lansat pentru abonamentele ChatGPT Plus și Teams. În timp ce capabilitățile avansate de raționament sunt în prezent opt-in cu limite de utilizare săptămânală, OpenAI lucrează pentru a extinde capacitatea și a permite selecția automată a modelului pe baza complexității solicitării.

OpenAI lansează modele AI „o1”, promițând raționament la nivel de doctorat în știință și matematică

Compania este atât de încrezătoare în abilitățile lui o1 încât a resetat numărul versiunii înapoi la 1

LĂSAȚI UN MESAJ Renunțați la răspuns