imagazin arrow2-left arrow2-right arrow2-top arrow-up arrow-down arrow-left arrow-right cart close dossiers education fb instagram menu notification oander rss rss-footer search service shuffle speech-bubble star store stores tests twitter youtube

Acesta este modul în care funcționează funcția „Hey Siri”


Machine Learning Journal a publicat un nou articol creat de Apple din care putem afla detalii despre modul în care funcționează funcția magică Hey Siri. Este incredibil la cât de multe detalii au fost atenți inginerii când au creat această funcție.

Faptul că Apple a început să-și publice aceste scurte articole despre cercetarea pe care o întreprind în domeniul inteligenței artificiale este cel mai bun lucru pe care l-ar fi putut face Apple pentru cei interesați de această tehnologie. Toată lumea cunoaște produsele Apple și mulți chiar le folosesc în fiecare zi, astfel încât aceste articole chiar dacă sunt puțin academice, chiar și simplii cititori pot lega informația de ceva. În acest ultim articol, ei împărtășesc detalii despre fundamentul tehnic al funcției Hey Siri. Hai să aruncăm o privire!

Cum funcționează?

Un senzor foarte mic, capabil de recunoaștere vocală, rulează tot timpul și ascultă pentru a detecta cele două cuvinte. Când detectează „Hey Siri”, restul lui Siri analizează următoarele cuvinte ca o comandă sau o interogare. Detectorul „Hey Siri” utilizează o rețea neuronală profundă (DNN) pentru a transforma în fiecare moment modelul acustic al vocii dvs. într-o distribuție de probabilități în funcție de sunetele vocii. Apoi, el utilizează un proces de integrare temporală pentru a calcula un scor de încredere pentru a evalua dacă fraza pe care ați spus-o a fost „Hey Siri”. Dacă scorul este suficient de ridicat, Siri se trezește.

Conservarea energiei

Pentru a evita rularea procesorului principal toată ziua doar pentru a asculta fraza declanșatoare, procesorul Always On (AOP) al iPhone-ului (un procesor auxiliar mic, cu putere redusă, adică Motion Coprocessor-ul) are acces la semnalul microfonului (începând de la modelul 6S). Utilizăm o mică parte din puterea de procesare limitată a AOP pentru a rula un detector cu o versiune mică a modelului acustic (DNN). Când scorul depășește un anumit prag, coprocesorul de mișcare trezește procesorul principal, care analizează semnalul folosind un DNN mai mare.

Procesul de configurare

Comparăm orice posibilă nouă exprimare a expresiei „Hey Siri” cu exemplele stocate după cum urmează: detectorul produce informația de sincronizare care este utilizată pentru a transforma modelul acustic într-un vector cu lungime fixă, luând în considerare media intervalelor aliniate fiecărei stări. Un DNN separat, special instruit, transformă acest vector într-un „spațiu al vorbitorului” unde, prin design, modelele acustice ale aceluiași vorbitor tind să fie mai apropiate, în timp ce modelele altor vorbitori diferă. Comparăm distanțele cu modelele de referință create în timpul perioadei de învățare pentru a decide dacă sunetul care a declanșat detectorul este posibil să fie „Hey Siri” rostit de utilizatorul înregistrat.

Un alt lucru interesant sunt configurațiile de sensibilitate automată. Există un prag primar (sau normal) și un prag mai mic care nu declanșează în mod normal Siri. Dacă scorul depășește pragul inferior, dar nu și pragul superior, sistemul intră într-o stare mai sensibilă pentru câteva secunde, astfel încât dacă utilizatorul repetă fraza, chiar fără a face mare efort, atunci declanșează Siri.

Acest mecanism pentru a doua șansă îmbunătățește în mod semnificativ gradul de utilizare al sistemului, fără a crește prea mult rata alarmelor false, fiind în această stare de extra-sensibilitate doar pentru o perioadă scurtă de timp.

Articole similare și postări interesante pot fi citite în revista Machine Learning Journal. O recomandăm tuturor deoarece merită citită.

sursa: Macrumors, iMore și Apple

iPhone 8
Apple Inc. (AAPL)

Ai citit asta?

„Fiecare Mac pe care îl cumpărăm permite IBM să economisească bani.”

Computerele care funcționează sub Windows ajung să fie, în final, de trei ori mai scumpe decât Mac-urile. ... - Apasă aici!