Distrugerea cărților este parțial motivul pentru care compania a câștigat apărarea „de utilizare corectă”
WTF?! AI generativă s-a confruntat deja cu critici puternice pentru problemele sale cunoscute cu fiabilitatea, consumul masiv de energie și utilizarea neautorizată a materialelor protejate de drepturi de autor. Acum, un dosar recent al instanței dezvăluie că instruirea acestor modele AI a implicat, de asemenea, distrugerea pe scară largă a cărților fizice.
Înmormântat în detaliile unei hotărâri recente împărțite împotriva antropicului este o revelație surprinzătoare: compania generativă AI a distrus milioane de cărți fizice prin tăierea legăturilor lor și aruncarea rămășițelor, toate pentru a -și instrui asistentul AI. În special, această distrugere a fost citată ca un factor care a adus decizia instanței în favoarea lui Antropic.
Pentru a construi Claude, modelul său de limbă și concurentul chatgpt, antropic instruit pe cât mai multe cărți pe care le -ar putea dobândi. Compania a achiziționat milioane de volume fizice și le -a digitalizat prin ruperea și scanarea paginilor, distrugând permanent cărțile în acest proces.
Mai mult, Antropic nu are de gând să pună la dispoziție public copiile digitale rezultate. Acest detaliu a ajutat la convingerea judecătorului că digitalizarea și răzuirea cărților a constituit o transformare suficientă pentru a se califica sub o utilizare corectă. În timp ce Claude folosește probabil biblioteca digitalizată pentru a genera conținut unic, criticii au arătat că modelele de limbaj mare pot reproduce uneori material verbatim din datele lor de instruire.
Victoria juridică parțială a Anthropic îi permite acum să instruiască modele AI pe cărți protejate de drepturi de autor, fără a anunța editorii sau autorii originali, potențial eliminând una dintre cele mai mari obstacole care se confruntă cu industria AI generativă. Un fost executiv de metale a recunoscut recent că AI va muri peste noapte, dacă este necesar să respecte legea dreptului de autor, probabil pentru că dezvoltatorii nu ar avea acces la vastele trove de date necesare pentru a antrena modele de limbaj mare.
Cu toate acestea, bătăliile de drepturi de autor în curs de desfășurare continuă să reprezinte o amenințare majoră pentru tehnologie. La începutul acestei luni, CEO-ul Getty Images a recunoscut că compania nu își poate permite să lupte cu fiecare încălcare a drepturilor de autor legate de AI. Între timp, procesul Disney împotriva Midjourney – unde compania a demonstrat capacitatea generatorului de imagini de a reproduce conținut protejat de drepturi de autor – ar putea avea consecințe semnificative pentru ecosistemul AI generativ mai larg.
Acestea fiind spuse, judecătorul din cazul antropic a pronunțat împotriva companiei pentru a se baza parțial pe bibliotecile de cărți piratate pentru a -l antrena pe Claude. Antropic trebuie să se confrunte în continuare cu un proces de drepturi de autor în decembrie, unde i s -ar putea dispune să plătească până la 150.000 USD pe muncă piratată.