More

    Facebook dezvoltă un sistem AI de recunoaștere a vorbirii

    URMĂREȘTE-NE

    16,065FaniÎmi place
    1,142CititoriConectați-vă
    13,030AbonațiAbonați-vă

    Facebook dezvoltă un sistem AI de recunoaștere a vorbirii. Acest lucru ar putea să aducă traduceri automate în mai multe țări.

    Facebook dezvoltă un sistem AI de recunoaștere a vorbirii

    Recunoașterea vorbirii este un conținut important în dezvoltarea AI ale companiilor Big Tech. Tehnologia alimentează asistenții digitali pe telefoane, din mașini și din boxele inteligente din casele noastre. Dar, în ciuda omniprezenței lor, recunoașterea vorbirii este încă în dezvoltare. Facebook anunță o descoperire majoră în modul în care antrenează aceste sisteme pentru a învăța noi limbi. Compania spune că a dezvoltat o metodă de construire a instrumentelor de recunoaștere a vorbirii care nu necesită date transcrise.

    Potrivit Facebook, noul său sistem poate oferi autonomie tehnologiei față de dependența sa de introducere a textului în vorbire. Sarcina presupunea ca oamenii să asculte și să transcrie audio, un proces monoton care trebuie repetat pentru fiecare limbă.

    Modelul Facebook se bazează în esență pe o buclă de feedback între o rețea contradictorie generativă (GAN) compusă dintr-un „generator” și un „discriminator”. Primul scoate reprezentări ale tiparelor de vorbire încărcate în rețeaua corespunzătoare, care acționează ca un fel de traducător.

    În același timp, Facebook introduce text suplimentar scris de oameni pentru a ajuta generatorul să înțeleagă diferența dintre rezultatele computerizate și cele din lumea reală. Acest proces se repetă până când soluția generatorului se potrivește cu textul real.

    Facebook spune că metoda sa i-a permis să creeze sisteme de recunoaștere a vorbirii fără seturi de date adnotate. Compania a testat deja modelul, cunoscut sub numele de Wav2vec-U în swahili, kârgâză și tătără din Crimeea.

    Testele Facebook au arătat că sistemul a produs cu 63% mai puține erori față de cea mai bună metodă nesupravegheată. Se adaugă că instrumentul este la fel de precis ca sistemele supravegheate de acum câțiva ani. Pentru a accelera dezvoltarea sa, Facebook a distribuit codul pentru Wav2vec-U pe GitHub.

    Compania spune că descoperirea ar putea introduce sisteme de recunoaștere a vorbirii pentru mai multe limbi și dialecte din întreaga lume, contribuind la democratizarea tehnologiei.

    Cele mai noi știri

    Pe același subiect

    Leave a reply

    Vă rugăm să introduceți comentariul dvs.!
    Introduceți aici numele dvs.