Apple spiega nel dettaglio come funziona il comando 'Hey, Siri'

La compagnia ha pubblicato un nuovo documento nel suo Machine Learning Journal in cui spiega il funzionamento del comando Hey, Siri per richiamare l'assistente virtuale

di Nino Grasso pubblicata il 20 Ottobre 2017, alle 08:21 nel canale Apple
Apple iOS iPhone iPad Watch

Si tratta di una lettura particolarmente complessa quella pubblicata da Apple all'interno del suo Machine Learning Journal (che potete trovare qui, in lingua inglese). Nella pagina la compagnia spiega quello che avviene durante l'esecuzione di uno dei comandi più semplici fra quelli disponibili su iPhone e Apple Watch, Hey Siri, insieme a tutte le complesse valutazioni che il software deve compiere per poter capire se il comando è da considerare valido e se appartiene all'utente originale.

Apple spiega che il microfono dei due dispositivi "trasforma la voce in un flusso di onde sonore istantanee, ad una velocità di 16000 campioni al secondo" prima che il sistema di rilevazione sia capace di dedurre la volontà di richiamare l'assistente vocale. Ogni campione ha una durata di circa 0,01 secondi e il modello acustico basato sulle reti neurali (Deep Neural Network, DNN) ne analizza 20 contemporaneamente per una durata di ogni singolo set di circa 0,2 secondi.

Con i campioni vengono svolti una valutazione probabilistica e un "processo di integrazione temporale" per ottenere un punteggio, e stabilire la coerenza dei campioni con il comando "Hey, Siri". Naturalmente Apple non richiede ai suoi sistemi di avere una certezza del 100% per richiamare l'assistente virtuale con l'uso della voce, in modo da garantire l'uso della funzionalità anche in ambienti in cui sono presenti anche altri suoni d'ambiente o altre voci sullo sfondo.

"Abbiamo integrato un po' di flessibilità in modo da rendere più facile l'attivazione di Siri in condizioni difficili, senza tuttavia aumentare il numero di false attivazioni", si legge nel documento. Ci sono due diverse soglie per stabilire l'attivazione dell'assistente virtuale, quella normale e quella bassa: se si supera quest'ultima ma non la prima il sistema potrebbe mancare un buon comando "Hey, Siri", ed è in queste circostanze che viene attivata una modalità più sensibile per alcuni secondi.

Questo succede del tutto automaticamente, in modo che se l'utente pronuncia nuovamente le due parole, anche senza aumentare il volume o essere più preciso, il sistema riesce a rilevare il tentativo di attivazione comportandosi adeguatamente. Questo consente, secondo Apple, di "migliorare significativamente l'usabilità del sistema senza aumentare il tasso di falsi positivi, visto che la sensibilità del riconoscimento viene aumentata solo per un breve periodo di tempo".

Nel documento vengono riportate anche altre informazioni già note: Hey Siri, ad esempio, si basa sul co-processore presente nei SoC degli ultimi modelli di iPhone in modo da funzionare senza richiedere alcuna interazione fisica e al tempo stesso senza pesare troppo in termini energetici sulla carica della batteria. Su Apple Watch invece il rilevamento della voce si attiva solo se viene percepito il movimento del polso verso l'alto, che attiva anche il display del dispositivo.

In questo modo il sistema può allocare solo una minima porzione (5%) della potenza concessa dal SoC di Apple Watch, dedicandola esclusivamente al riconoscimento della voce, e solo per una piccola porzione di tempo rispetto all'intero arco della giornata. Chi volesse approfondire l'argomento può farlo a questo indirizzo, sul sito Apple Machine Learning Journal.

I migliori sconti su Amazon oggi

-21%

CMF Phone 1 8+128GB - Smartphone con fotocamera posteriore Sony da 50 MP con Ultra XDR, Display Super AMOLED da 6,67 pollici e Nothing OS 2.6, Nero, Non supporta eSIM

239.00 189.00€ Compra ora

-42%

Cecotec Friggitrice ad Aria Senza Olio Cecofry Fantastik 5500 da 5,5 L. 1500W, Tecnologia PerfectCook, 9 modalità di cottura, Touch, Regolabile 80-200°C, Cottura fino a 60 minuti

76.90 44.90€ Compra ora

-18%

Apple iPhone 16 128 GB: Telefono 5G con Controllo fotocamera, chip A18 e tanta autonomia in più. Compatibile con AirPods; bianco

979.00 799.00€ Compra ora

Filo presenta Filo Tag, una targhetta con Bluetooth per non perdere mai nulla

Da Thrustmaster un pack per chi ama l’uso simultaneo di due joystick

Gyammy8520 Ottobre 2017, 08:28 #1

E se uno dice hey cortana che succede?

dominator8420 Ottobre 2017, 08:54 #2

Originariamente inviato da: Gyammy85

E se uno dice hey cortana che succede?

Ti mandano pupo a casa e ggli fanno cantare in loop gelato al gioccolato...
E ti va bene...
Nel peggiore dei casi, ti possono mandare d'alessio e la tatangelo in duetto...

Gyammy8520 Ottobre 2017, 08:57 #3

Originariamente inviato da: dominator84

Ti mandano pupo a casa e ggli fanno cantare il loop gelato al gioccolato...
E ti va bene...
Nel peggiore dei casi, ti possono mandare d'alessio e la tatangelo in duetto...

Nel senso che apple ha inventato anche questo, quando coi win phone hey cortana c'è tipo dal 2014 quando uscì il lumia 930
It's sooooo maggicc...think different

Notturnia20 Ottobre 2017, 09:11 #4

in automobile parlo con il sistema vocale da molto prima che hey cortana ed hey siri saltassero fuori.. certo devo premere un tasto sul volante.. ma questa enfasi su chi è arrivato prima a fare una fesseria è allarmante..

io questi sistemi li ho disattivati.. consumano per niente e se li voglio attivare premo un tasto..

Kehlstein20 Ottobre 2017, 09:19 #5

Originariamente inviato da: Notturnia

io questi sistemi li ho disattivati.. consumano per niente e se li voglio attivare premo un tasto..

La differenza è che tu premi un tasto sul volante, mentre chi ha il telefono poggiato nel suo holder sul cruscotto e non ha collegato alcun tipo di vivavoce, dovrebbe comunque distrarsi dalla guida per andare a premere un pulsante.
Io non l'ho attivato e lo uso molto. Trovo più comodo, e anche più sicuro, richiamare l'assistente vocale senza distrarmi dalla guida.

kirylo20 Ottobre 2017, 09:27 #6

A quando un telefono denza microfono?

Il giorno che vendono uno smartphone senza microfono, lo compro. Non sopporto più questi spioni del deep learning. Voglio uno smartphone con microfono plug in, così sono sicuro che non sono in costante ascolto di quello che dico.

Birkhoff9220 Ottobre 2017, 09:36 #7

riferito all'ultimo commento : ma chi vuoi che ti ascolti visto che non sei una persona importante ? Cioè non sei nè un presidente nè un rifugiato politico , niente che dovrebbero ascoltare ? bah tutta sta paranoia alla Mr Robot vi fonde solo il cervello ..... quindi secondo te avendo il cell in auto sentono pure quando faccio sesso ?

Kehlstein20 Ottobre 2017, 09:50 #8

Originariamente inviato da: Birkhoff92

riferito all'ultimo commento : ma chi vuoi che ti ascolti visto che non sei una persona importante ? Cioè non sei nè un presidente nè un rifugiato politico , niente che dovrebbero ascoltare ? bah tutta sta paranoia alla Mr Robot vi fonde solo il cervello ..... quindi secondo te avendo il cell in auto sentono pure quando faccio sesso ?

Mi hai strappato una risata... se ascoltano me quando guido, al massimo si ascoltano i queen..

PaoPaolo20 Ottobre 2017, 09:51 #9

#event "Hey Siri"
if "Hey Siri" and time before coffee
then say "Azzo vuoi?"
else
say "Siiiii?"
end

*aLe20 Ottobre 2017, 09:57 #10

Originariamente inviato da: PaoPaolo

#event "Hey Siri"
if "Hey Siri" and time before coffee
then say "Azzo vuoi?"
else
say "Siiiii?"
end

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Sony FE 50-150mm F2 G Master. il bokeh monster ora è zoom

Mazda 6e è l'elettrica della svolta

Star Wars: Bruno

114

World Press Photo: i vincitori del Contest 2025

Renault 5 Turbo 3E

Toyota C-HR+, ecco le primissime foto dell'auto elettrica giapponese

Lenovo ThinkPad X9-14 Aura Edition: leggero e sottile per i professionisti Abbina una costruzione molto curata, con un telaio in alluminio leggero, sottile e robusto, ad una piattaforma Intel Core Ultra 7 di ultima generazione con supporto...

REDMAGIC 10 Air: potenza da gaming in un corpo leggero e moderno. Recensione REDMAGIC 10 Air è l'evoluzione degli smartphone da gaming con un design più sottile e leggero rispetto al 10 Pro, mantenendo prestazioni elevate grazie allo Snapdragon...

Analisi tecnica The Last of Us Parte II Remastered per PC: stavolta ci siamo! Abbiamo avuto l'opportunità di provare The Last of Us Parte II Remastered per PC, titolo che chiude (almeno stando alle parole di Naughty Dog) una delle saghe simbolo...

DJI Osmo Mobile 7P: ti segue anche con la fotocamera nativa dello smartphone! Grande novità per il nuovo gimbal DJI Osmo Mobile 7P: grazie al modulo multifunzione incluso, dotato di telecamera, ora l'inseguimento del soggetto è possibile anche...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

CRESCO8, la Formula 1 dell’HPC: ENEA e Lenovo insieme per affrontare le sfide della ricerca ENEA inaugura CRESCO8, il supercomputer realizzato con Lenovo per affrontare le grandi sfide scientifiche: dalla fusione nucleare al clima, dalla bioinformatica...

Renault Emblème: la familiare del futuro elettrica, sostenibile e riciclabile Con il progetto Emblème Renault propone una vettura familiare importante nelle dimensiooni, che abbina batteria elettrica ad un'alimentazione alternativa a idrogeno...

Fujifilm X100VI: con le 'ricette' è la fotocamera più divertente del momento Fujifilm X100VI è la fotocamera perfetta per divertirsi con la street photography: è tascabile, offre grande qualità, ma soprattutto permette di giocare molto con...

No Rss

Apple spiega nel dettaglio come funziona il comando 'Hey, Siri'

CMF Phone 1 8+128GB - Smartphone con fotocamera posteriore Sony da 50 MP con Ultra XDR, Display Super AMOLED da 6,67 pollici e Nothing OS 2.6, Nero, Non supporta eSIM

Cecotec Friggitrice ad Aria Senza Olio Cecofry Fantastik 5500 da 5,5 L. 1500W, Tecnologia PerfectCook, 9 modalità di cottura, Touch, Regolabile 80-200°C, Cottura fino a 60 minuti

Apple iPhone 16 128 GB: Telefono 5G con Controllo fotocamera, chip A18 e tanta autonomia in più. Compatibile con AirPods; bianco

20 Commenti