Ti sei mai chiesto come l'Apple HomePod riesce a sentirti dire "Ehi Siri" dall'altra parte della stanza rumorosa? Ci sono volute molte persone molto intelligenti per realizzarlo.
Un nuovo post sul blog di machine learning di Apple descrive in dettaglio tutto il pensiero e la tecnologia, sia hardware che software, dietro la capacità dell'altoparlante a forma di marshmallow di aggrapparsi a ogni tua parola. Le sfide, a quanto pare, erano piuttosto immense.
Video consigliati
"Il tipico ambiente audio per HomePod presenta molte sfide: eco, riverbero e rumore", spiega Apple. “A differenza di Siri su iPhone, che funziona vicino alla bocca dell’utente, Siri su HomePod deve funzionare bene in un ambiente lontano. Gli utenti desiderano invocare Siri da molti luoghi, come dal divano o dalla cucina, indipendentemente da dove si trova HomePod.
Imparentato
- Quanto costa Spotify Premium e puoi ottenere un accordo?
- Presto, Apple AirPods Pro sarà in grado di reagire al tuo ambiente
- Ecco come puoi ottenere The Last of Us gratuitamente da AMD
Per affrontare questi problemi, il team ha utilizzato una combinazione di ciò che chiama “apprendimento profondo supervisionato” e “apprendimento online non supervisionato” per determinare come interpretare i segnali provenienti dai suoi molteplici strumenti a bordo microfoni. In sostanza, l'oratore è in grado di utilizzare questo algoritmo di apprendimento automatico per determinare qual è il flusso audio ottimale per ascoltare in qualsiasi momento, permettendogli di avere sempre un orecchio attento per capire dove potrebbe sentire "Ehi Siri".
Esiste un sacco di software interessanti che consentono a chi parla di ottimizzare il rilevamento del parlato e di escludere elementi come musica, suoni ambientali e altro audio non vocale. Ma anche quando si concentra sulla parola, ci sono altre sfide.
"Il riconoscimento vocale a distanza diventa più difficile quando un altro interlocutore attivo, come una persona o un televisore, è presente nella stessa stanza con l'interlocutore target", si legge nel post. "In questo scenario, il rilevamento del trigger vocale, la decodifica del parlato e l'endpoint possono essere sostanzialmente ridotti se il comando vocale non è separato dai componenti del parlato interferenti."
Il team ha sviluppato una formula unica per affrontare questo problema: la formula attuale può essere trovata su il sito Web dell'azienda e ha persino sviluppato metodi speciali per gestire la cancellazione dell'eco e soppressione.
Il fatto che sia stata pensata così tanto per creare un prodotto come HomePod e farlo funzionare davvero non è poi così sorprendente, ma essere in grado sentire esattamente quali fossero le sfide e come sono state risolte direttamente da Apple, una delle aziende più riservate sulla Terra, lo è rinfrescante. Ti consigliamo di consultare l'intero post del blog per ulteriori informazioni.
Mentre ci sei, assicurati di controllare il nostro elenco di i migliori altoparlanti intelligenti se sei nel mercato.
Raccomandazioni degli editori
- Quanto costa Apple Music e come puoi ottenerlo gratuitamente?
- Cos'è l'NFC? Come funziona e cosa puoi farci
- Cos'è Dolby Atmos Music e come puoi ascoltarlo a casa e in viaggio?
- Andiamo, Apple: se Sonos può ammettere di aver sbagliato riguardo al Bluetooth, puoi farlo anche tu
- Apple AirPlay 2: spiegazione completa della tecnologia di streaming audio e video wireless
Migliora il tuo stile di vitaDigital Trends aiuta i lettori a tenere d'occhio il frenetico mondo della tecnologia con tutte le ultime notizie, divertenti recensioni di prodotti, editoriali approfonditi e anteprime uniche nel loro genere.