Facebook dezvoltă un sistem AI de recunoaștere a vorbirii

Facebook dezvoltă un sistem AI de recunoaștere a vorbirii. Acest lucru ar putea să aducă traduceri automate în mai multe țări.

Facebook dezvoltă un sistem AI de recunoaștere a vorbirii

Recunoașterea vorbirii este un conținut important în dezvoltarea AI ale companiilor Big Tech. Tehnologia alimentează asistenții digitali pe telefoane, din mașini și din boxele inteligente din casele noastre. Dar, în ciuda omniprezenței lor, recunoașterea vorbirii este încă în dezvoltare. Facebook anunță o descoperire majoră în modul în care antrenează aceste sisteme pentru a învăța noi limbi. Compania spune că a dezvoltat o metodă de construire a instrumentelor de recunoaștere a vorbirii care nu necesită date transcrise.

Potrivit Facebook, noul său sistem poate oferi autonomie tehnologiei față de dependența sa de introducere a textului în vorbire. Sarcina presupunea ca oamenii să asculte și să transcrie audio, un proces monoton care trebuie repetat pentru fiecare limbă.

Modelul Facebook se bazează în esență pe o buclă de feedback între o rețea contradictorie generativă (GAN) compusă dintr-un „generator” și un „discriminator”. Primul scoate reprezentări ale tiparelor de vorbire încărcate în rețeaua corespunzătoare, care acționează ca un fel de traducător.

În același timp, Facebook introduce text suplimentar scris de oameni pentru a ajuta generatorul să înțeleagă diferența dintre rezultatele computerizate și cele din lumea reală. Acest proces se repetă până când soluția generatorului se potrivește cu textul real.

Facebook spune că metoda sa i-a permis să creeze sisteme de recunoaștere a vorbirii fără seturi de date adnotate. Compania a testat deja modelul, cunoscut sub numele de Wav2vec-U în swahili, kârgâză și tătără din Crimeea.

Testele Facebook au arătat că sistemul a produs cu 63% mai puține erori față de cea mai bună metodă nesupravegheată. Se adaugă că instrumentul este la fel de precis ca sistemele supravegheate de acum câțiva ani. Pentru a accelera dezvoltarea sa, Facebook a distribuit codul pentru Wav2vec-U pe GitHub.

Compania spune că descoperirea ar putea introduce sisteme de recunoaștere a vorbirii pentru mai multe limbi și dialecte din întreaga lume, contribuind la democratizarea tehnologiei.

Philips 275E2FAE/00 REVIEW: Monitor LCD QHD pentru toate buzunarele

Surefire Buzzard Claw Review

Review Samsung Galaxy Watch4 la 1 an de la lansare

Review mouse ergonomic vertical Trust Verto

Suporturi pentru birou de care avem nevoie

Microsoft Excel: 100 de scurtături utile

Smart Home: Cum alegi produsele potrivite și ce să eviți

Cardurile SD: Clasele de viteză și de ce contează ele

Cu YOXO, clienții sunt mai responsabili cu mediul și pot reduce amprenta de carbon

Orange România prezintă noua ofertă comună de servicii fix-mobil

PC Garage anunţă Black Friday „mai devreme”

Orange România anunță rezultatele financiare

Samsung Customer Service Plaza ridică standardul în reparații

Black Friday de la eMAG vine cu 1,5 milioane de oferte

Mai sunt 4 zile de Samsung Festival

PC Garage intel Days te echipează gratuit cu un cooler cadou

Cele opt episoade din serialul WEDNESDAY sunt disponibile

HBO Max produce Spy/Master, un nou serial Max Original

Domnia Casei Targaryen: Primul episod

Netflix va taxa suplimentar conturile cu utilizatori multipli

Facebook dezvoltă un sistem AI de recunoaștere a vorbirii