Quote:
Originariamente inviato da misterx
stavo giusto pensando ai principi dietro al riconoscimento. Ad esempio, android che consente la ricerca vocale, mi chiedevo se dietro ci fosse un db con le relative relazioni:
<un valore calcolato in qualche modo analizzando il campione sonoro><parola associata al calcolo, secondo una certa percentuale di probabilità>
|
Nel senso il file MP3 della voce è registrato sul db come blob per non essere solo salvato su file system.
Serve di certo una lib che traduca MP3 da audio in testo. Il problema è estrarre le informazioni dal testo.
Come faccio a capire se mi ha chiesto un taxi in un certo posto? Se l'operatore imposta delle domande in automatico del tipo in che località/posto desidera il taxi?
Allora io posso prendere tutto ciò che viene dopo la domanda fino alla successiva domanda. Perché non è come le form web in cui hai il campo località e lo compili e sai esattamente che è quello. Qui informazione è sparsa nel testo.
Come si potrebbe fare?