Gen3 AI Modele Claude 3.7 și Grok 3 împingeți limitele în codificare și sarcini complexe

Progresele lor vor stârni o trecere de la automatizarea sarcinilor la parteneriat intelectual

Imaginea de ansamblu: În ultimele zile, comunitatea AI a asistat la apariția unei noi generații de modele AI, anunțând un salt semnificativ în capacități și aplicații potențiale. Claude 3.7 și Grok 3 împing limitele a ceea ce AI poate realiza, în special cu sarcini complexe, matematică și codificare.

Aceste modele Gen3 reprezintă un salt cuantic în puterea de calcul utilizată în timpul antrenamentului, potrivit unei postări scrise de Ethan Mollick în Buletinul informativ substitut, un lucru util. Grok 3, dezvoltat de Elon Musk’s Xai, este primul model cunoscut care a utilizat un ordin de mărime mai mare putere de calcul decât predecesorul său, GPT-4. Claude 3.7, din partea sa, prezintă îmbunătățiri substanțiale ale performanței și introduce noi capacități de codificare și raționament.

Progresele în aceste modele sunt susținute de două „legi de scalare” critice identificate de OpenAI. Prima lege, ilustrată pe partea stângă a graficului, demonstrează că modelele mai mari instruite cu mai multă putere de calcul prezintă capacități îmbunătățite. Această relație nu este liniară; De obicei, este necesară o creștere de zece ori a puterii de calcul pentru a obține o îmbunătățire liniară a performanței.

Credit de imagine: Ethan Mollick

Scara puterii de calcul implicate în formarea acestor noi modele este uluitoare. Modelele Gen3 utilizează peste 10^26 de flopuri în timpul antrenamentului, echivalent cu rularea unui smartphone modern timp de 634.000 de ani sau computerul de orientare Apollo timp de 79 de trilioane de ani.

A doua lege de scalare, reprezentată pe partea dreaptă a graficului, dezvăluie un fenomen intrigant: performanța AI poate fi îmbunătățită, permițând modelului mai mult timp pentru procesarea informațiilor în timpul rezolvării problemelor.

Această descoperire a dus la dezvoltarea de „Reasonters”, sisteme AI care pot aloca resurse de calcul suplimentare pentru a aborda problemele complexe mai eficient în funcție de Mollick.

Aceste progrese nu sunt doar academice; Au implicații profunde pentru aplicațiile din lumea reală. De exemplu, Claude 3.7 a demonstrat capacitatea de a crea vizualizări 3D interactive ale conceptelor academice complexe și de a genera cod funcțional prin conversații în limbaj natural.

Într -un exemplu, AI a produs un artefact interactiv al mașinii de timp completat cu grafică de pixeli, prezentându -și capacitatea de sarcini creative și tehnice.

Cu toate acestea, Mollick observă că, deși aceste sisteme sunt impresionante, nu sunt infailibile. Încă fac greșeli și au limitări. Cu toate acestea, ritmul rapid de îmbunătățire sugerează că capacitățile AI vor continua să se extindă.

Așa cum se întâmplă, ei contestă „mentalitatea de automatizare” predominantă în mediile corporative, care consideră adesea AI în principal ca un instrument pentru eficientizarea proceselor existente. În schimb, potrivit lui Mollick, aceste noi modele invită o regândire fundamentală a ceea ce este posibil, poziționând AI ca un potențial partener intelectual capabil să abordeze sarcini analitice complexe, muncă creativă și chiar probleme la nivel de cercetare.

Această schimbare va necesita o nouă abordare a integrării AI în organizații. Liderii trebuie să treacă dincolo de automatizarea sarcinilor către creșterea capacității, întrebând nu doar ceea ce poate fi automatizat, ci și ce noi capacități pot fi deblocate.

Pe măsură ce aceste modele devin mai accesibile, Mollick îndeamnă indivizii și organizațiile să -și exploreze capacitățile de primă mână. Atât Claude 3.7, cât și Grok 3 oferă caracteristici și puncte forte unice, Claude 3.7 oferind capacități de execuție a codului și Grok 3 oferind un set mai larg de capabilitate, inclusiv opțiuni de cercetare profundă.

Gen3 AI Modele Claude 3.7 și Grok 3 împingeți limitele în codificare și sarcini complexe

Progresele lor vor stârni o trecere de la automatizarea sarcinilor la parteneriat intelectual

LĂSAȚI UN MESAJ Renunțați la răspuns