Modelele AI nu au niciun indiciu despre ce este de fapt șahul sau ce mișcări sunt valabile
Redactor de luare: În ciuda faptului că sunt salutate ca următorul pas în evoluția inteligenței artificiale, modelele de limbaj mare nu sunt mai inteligente decât o bucată de lemn putred. Din când în când, un experiment sau un test ciudat reamintește tuturor că așa-numitul AI „inteligent” nu există de fapt dacă trăiești în afara raportului trimestrial al unei companii tehnologice.
O emulație cu ciclu de ciclu a procesorului Atari 2600 care rulează la o scădere de 1,19 MHz este mai mult decât suficientă pentru a umili chatgpt-ul într-un joc de șah. Inginerul Citrix, Robert Jr. Caruso, a efectuat micul experiment „amuzant” în weekend, punând în considerare puternicul chatbot al lui Openai împotriva unei console virtuale Atari 2600 emulate de Stella. Nu s -a încheiat bine pentru chatbot.
Se pare că Caruso a primit ideea de la Chatgpt în sine, după ce a discutat cu botul despre istoria AI și a șahului. Serviciul lui Openai s -a oferit voluntar pentru a juca „Atari Chess”, pe care Caruso și -a asumat -o la Chess Video – singurul titlu de șah lansat vreodată pentru Atari 2600.
În ciuda faptului că i s -a oferit un aspect de bază al consiliului de administrație pentru a identifica piesele, Chatgpt s -a luptat. Bot -ul a confundat rook -urile pentru episcopi, au ratat furculițele evidente de amanet și au făcut o serie de gafe neplăcute, potrivit lui Caruso. La un moment dat, Chatgpt a dat vina chiar factori externi, cum ar fi simbolurile abstracte utilizate de șahul video pentru a înfățișa piesele pentru incapacitatea sa de a urmări starea jocului.
„Timp de 90 de minute, a trebuit să -l opresc să facă mișcări groaznice și să -și corecteze conștientizarea bordului de mai multe ori pe rând”, a spus inginerul despre performanțele lui Chatgpt împotriva unei console de procesare emulată din anii 70.
Aparent, bot a cerut să repornească jocul în speranța de a-și îmbunătăți performanța, dar a fost în cele din urmă învins de un motor de șah pe 8 biți. Un procesor de 1 MHz ar trebui, în cel mai bun caz, să poată gândi una sau două mișcări înainte, în timp ce ChatGPT se bazează pe o armată nesfârșită de GPU-uri moderne, înfometate de putere, pentru a-și menține serviciul de chat în funcțiune. Și totuși, procesorul de 1 MHz a câștigat, aruncând chatbot la nivel de începători.
Experimentul lui Caruso este un memento util despre modelele LLM sunt de fapt: un motor de căutare complex, bazat pe euristică, conceput pentru a vă mulțumi constant utilizatorului final cu un fel de rezultat captivant. Ei nu „știu” nimic, nu au capacități de raționament sau de deducere și, cu siguranță, nu au nicio inteligență pe cont propriu. Și sug absolut la șah.
Nu am deținut niciodată un Atari 2600 în timpul zilei, deși am petrecut câteva după -amieze glorioase cu consola mea puternică de intelection. Data viitoare, voi încerca să se umilească chatgpt făcându -l să joace o rundă de șah de luptă pe o replică emulată a primei mele mașini X86: un 80286 care rulează la un blazing de 16 MHz.