Questionari compilati con la voce, un dialogo continuo tra dispositivo ed intervistato, il futuro del CATI. 

La diffusione delle tecnologie cloud e dei sistemi distribuiti di informazioni ha accelerato lo sviluppo dei sistemi esperti, vale a dire i sistemi che apprendono, che possono essere addestrati, che comprendono un linguaggio e la sua semantica. Inevitabilmente le tecnologie di comprensione vocale hanno fatto un balzo in avanti e hanno raggiunto una diffusione capillare nel settore della domotica.  Fatta questa doverosa premessa, abbiamo immaginato il potenziale che potrebbe avere questa tecnologia innovativa nelle ricerche di mercato. Nell’immaginario di clienti e ricercatori il massimo livello di interazione tra software e intervistato è rappresentato dall’IVR  (Interactive Voice Response), ma qui parliamo di altro.

Abbiamo effettuato alcuni test su un panel di utilizzatori dai 50 ai 75 anni, e i risultati ci hanno davvero convinto.  Agli intervistati è stato fornito un dispositivo voice-enabled, a scelta tra Google Home mini e Amazon Echo Dot, e sono stati somministrati questionari vocali per una settimana. 

Superata la fase iniziale di accensione e collegamento del dispositivo alla wifi, gli intervistati hanno dialogato con l’assistente vocale in maniera semplice ed intuitiva. Nella sperimentazione fatta non abbiamo riscontrato problemi di alcun tipo tanto nella somministrazione di questionari quantitativi, quanto nella gestione di diari qualitativi.

La realizzazione dello script richiede tuttavia competenze di programmazione software che vanno ben oltre il semplice scripting. I questionari vocali sono infatti un’estensione dei questionari CAWI: questi ultimi viaggiano come pacchetti tra server applicativi e client web (browser) che scambiano dati seguendo un protocollo ben noto, l’HTTP. Facendo alcune semplificazioni, l’HTTP è un protocollo di tipo request-response: ad ogni richiesta c’è una risposta e tutto termina lì. I questionari voice-enabled al contrario funzionano come se ci sia un canale sempre aperto e le richieste tra server e client possono essere molteplici; ogni richiesta arricchisce il sistema esperto che migliorerà le risposte e la comprensione del contesto e questo è conosciuto come “multi-turn dialog“.

La conversazione è legata al riconoscimento di specifiche richieste, gli “intent“, che rappresentano le richieste effettuate dall’intervistato (ad es. “Alexa apri questionario”, oppure “Alexa ho fatto un nuovo acquisto”). Le richieste includono gli “slot” che rappresentano i parametri della richiesta. Alla richiesta segue l’avvio della conversazione con una risposta appropriata al contesto invocato.

Compresi i meccanismi alla base delle interfacce conversazionali, la progettazione di un questionario diventa abbastanza semplice e può essere gestita mediante un diagramma di flusso. Di seguito alcune delle schermate della progettazione effettuata con un tool dedicato. 

E per terminare ecco un video dimostrativo che abbiamo realizzato.