Genie a ieșit din sticlă și continuă coșmaruri 3D halucinante pentru ca copiii AI să se bucure
Prin oglindă: Numărul de cazuri potențiale de utilizare pentru instrumentele AI generative crește rapid. Cu modelul său recent introdus în linia Genie, Google dorește acum să ofere „creativilor” care nu au abilități de construire a lumii o modalitate simplă și rapidă de a-și prototipa ideile.
Genie 2 este un nou model de fundație capabil să genereze o cantitate „nesfârșită” de medii 3D care pot fi controlate de utilizator, a spus Google. AI-ul generativ poate dezvolta o întreagă lume virtuală bazată pe un singur prompt textual și pe o imagine eșantion, care poate fi fie creată de utilizator, fie generată de modele AI externe.
Alte companii încearcă să transforme tehnologia AI generativă într-o minune de construcție a lumii, deși rezultatele pot varia. Experimentul Oasis a fost conceput pentru a genera o experiență asemănătoare Minecraft cadru cu cadru, dar seamănă doar cu o lume Minecraft cu definiție joasă, afectată de demență în acest moment. Genie 2 poate menține o lume aparent consistentă până la un minut, asigură Google, deși încă vorbim despre o mizerie vizuală de joasă rezoluție, deformată și foarte neplăcută de vizionat.
Oricum, Google nu pare să fie interesat de repulsia vizuală sau de problemele neobișnuite ale văii. Mountain View a spus că jocurile joacă un aspect cheie în cercetarea AI, oferind un mediu ideal pentru a testa noi capabilități. Lumile Genie 2 pot fi controlate de un om slab, folosind o combinație tradițională de tastatură și mouse, modelul generativ simulând toate consecințele acțiunilor jucătorilor.
Spre deosebire de SIMA recent lansat, Genie 2 poate oferi reacții vizuale „inteligente” într-un mediu virtual generat la nesfârșit. Modelul AI poate genera diferite rute, sau „experiențe contrafactuale” pentru agenții de formare, pornind de la același cadru de bază. Cu diferite acțiuni întreprinse de jucătorul uman, lumea din jur se schimbă și halucinează în consecință.
Genie 2 poate aminti, de asemenea, părți ale lumii virtuale generate anterior, care se află în afara camerei jucătorului, și chiar le poate reda „cu acuratețe” atunci când revin în cadru. Modelul poate crea diferite perspective ale jucătorilor, inclusiv vedere la persoana întâi, vederi izometrice și carlinge de conducere pentru persoana a treia. Structurile 3D complexe și interacțiunile obiectelor fac, de asemenea, parte din amestec.
Capacitățile suplimentare ale noului model de fundație includ animația personajelor, NPC-urile, fizica, fumul, gravitația, iluminarea și reflexiile. Google a spus că Genie 2 și tehnologia AI generativă similară ar putea fi utile pentru a prototipa și a experimenta experiențe interactive, jocurile fiind prima aplicație potențială care îmi vine în minte. Cercetarea este încă în fazele sale incipiente, ceea ce înseamnă că există mult loc de îmbunătățire în timpul următoarelor câteva sesiuni de antrenament model.