Lo schermo è quello di un normale computer e la persona che gli sta davanti è un normale essere umano. Quello che cambia è il modo in cui uomo e macchina interagiscono fra loro. L’uomo prende di mira con lo sguardo una piccola immagine fra quelle presentate dal display e pronuncia un ordine: “Blast!” (“Apriti!”). Immediatamente l’immagine ‘prescelta’ con lo sguardo – in questo caso una radiografia – viene ingrandita a tutto schermo. Al che l’uomo – un medico – concentra lo sguardo su una sezione particolare dell’immagine e incalza: “Forward, forward, forward”. Ad ogni ‘avanti’ la porzione d’immagine selezionata s’ingrandisce.
Ma con un altro comando vocale il dottore, se vuole, può rimpicciolirla, o, ruotando la testa, spostarla a destra o a sinistra e, infine, copiarla o evidenziarla con un colore a suo piacimento. Una scena di questo tipo sembra appartenere a un futuro fantascientifico alla ‘Minority Report’ (ricordate Tom Cruise e il suo modo di manipolare le immagini al computer nell’anno 2054?). Invece è già realtà. Grazie ai prodigi del cosiddetto ‘eye tracking’ (il ‘tracciamento oculare’) e al lavoro di un gruppo di informatici tutti italiani, riuniti sotto il cappello di Sr Labs, una società di Milano che in questo settore d’avanguardia si è ritagliata un ruolo di prestigio a livello internazionale. Il team creato e guidato da Francesco Maringelli, amministratore delegato di Sr Labs, ha infatti sviluppato la prima interfaccia multimodale integrata sguardo-voce che, combinando un eye-tracker con un sistema di ‘voice recognition’, consente di fare ben più di quanto finora fosse possibile, aprendo di fatto una nuova frontiera nell’interazione uomo-computer: quella in cui mouse e tastiera (i dispositivi tradizionali attraverso cui finora si sono dati ordini a una macchina) vengono soppiantati da soluzioni ‘handless’, senza l’uso delle mani. è ciò che alla Sr Labs chiamano Cavs, Computer Aided Visualization System.
Va da sé che, almeno inizialmente, sistemi così sofisticati e all’avanguardia siano diretti a utenze professionali o a persone con gravi handicap, in particolar modo a chi ha perso l’uso degli arti superiori. Ecco perché la prima applicazione di questo tipo sviluppata dall’azienda italiana in collaborazione con Fimi (società del gruppo Philips) è stata I-Med, una consolle medicale per la diagnostica di immagini (radiografiche o acquisite con altre modalità quali ecografia, endoscopia, Tac e risonanza magnetica) controllabili mediante sguardo e voce. “Presenteremo il prototipo definitivo a novembre a Chicago, alla più importante rassegna internazionale di radiologia”, dice Maringelli, “e per quella data iMed sarà già dotata anche di un sistema ‘speech to text’ (un sistema di dettatura che trasforma le parole in testo scritto) di altissima precisione”.
“Quello che l’applicazione avanzata di queste tecnologie consentirà è un vero e proprio cambio di paradigma”, nota Andrew Duchowski, professore di computer science e ricercatore specializzato in eye-tracking all’università americana di Clemson: “Non saremo più noi a dover prestare attenzione ai nostri apparecchi elettronici, peraltro sempre più numerosi (computer, palmari, cellulari). Saranno questi – una volta che avremo loro donato la ‘vista’ – a doversi preoccupare di capirci”. Duchowski è convinto che, grazie all’implementazione di micro-sistemi di eyetracking, computer portatili e telefonini saranno in grado di seguire lo sguardo di una persona e intuire così dov’è rivolta la sua attenzione, sì da desumerne di conseguenza i comportamenti. “In questo modo”, conferma Leandro Agrò, a capo delle attività di Advanced Design di Sr Labs, “gli apparecchi saranno ‘perceptual driven’: sapranno per esempio quando è il caso di non di sturbarci se siamo impegnati in una conversazione telefonica o avvisarci quando ce ne sarà bisogno (per esempio se siamo alla guida di un’auto e siamo distratti o stiamo per avere un colpo di sonno, segnale questo identificabile dall’eye-tracker in base al battito delle nostre palpebre)”. Applicazioni di eye-tracking di questo tipo sono meglio conosciute come Aui (Attentive user interface) e, secondo Duchowski, “nel giro dieci anni saranno di ordinaria amministrazione”.
Come spesso accade quando si tratta di tecnologie ad alto tasso d’innovazione, i primi a sperimentarle e a farne uso sono in genere i militari. Non a caso i piloti di caccia americani a bordo dei Falcon F-16 e F-18 già oggi utilizzano dei ‘combat helmets’, caschi da combattimento elettronici, attraverso i quali il puntamento degli obiettivi viene effettuato tramite un sensibilissimo sistema di eye tracking (in questo settore l’israeliana Elbit è assolutamente all’avanguardia). Dato che gli impulsi dei nervi retinali e il movimento oculare sono più veloci rispetto all’azione fisica della mano di un venticinquesimo di secondo e che in fase di combattimento anche tempi minimi possono fare la differenza tra la vita e la morte, è chiaro che l’adozione di un’interfaccia elettronica che consenta al casco di comunicare con il sistema di puntamento e di fuoco del caccia, mettendo i dati critici a meno di 8 centimetri dall’occhio e dalla volontà del pilota, diventa determinante. “Quando hai imparato come si indossa e come si utilizza il casco (tecnicamente integrato nel Joint Helmet-Mounted Cueing System) si resta impressionati”, racconta il capitano Kevin Lord, pilota di F-16: “Individui l’obiettivo, miri e fai fuoco a una rapidità sorprendente, oltre a poter mantenere traccia visiva istantanea dell’altitudine, della velocità e di ogni dato rilevante per il controllo del velivolo”.
Molto più innocuo un altro uso dell’eye tracking, quello relativo alla cosiddetta ‘regia inconscia’, appena brevettata da Sr Labs a uso dei telefonini di terza generazione. In questo caso, invece di inviare al cellulare un filmato nella sua versione completa, se ne può far arrivare una versione in cui cioè sono state ritagliate e zoomate in maniera del tutto automatica le parti interessanti , quelle su cui si sofferma l’occhio inconsciamente. “Eliminare il più possibile i dettagli non significativi è una cosa fondamentale per l’ottimizzazione di un videogol”, spiega Agrò: “Se si ha presente cosa voglia dire vedere un filmato su un telefonino Umts con un video da qualche centinaio di pixel, è chiaro che eliminare il più possibile i dettagli inutili è fondamentale”. Lo stesso principio potrà essere adottato su ogni tipo di contenuto che va su display piccoli, dal film al videogioco.
La frontiera più avvincente legata allo sviluppo dell’eye tracking è quella che insegnerà alle macchine a diventare intelligenti, capaci di comprendere e prevedere le necessità di chi le sta usando: “Immaginiamo per esempio che, avendo a disposizione abbondanti quantità di dati sui movimenti oculari di una certa quantità di radiologi, si possa ricostruire un modello di osservazione e diagnosi delle radiografie che il computer può apprendere, imparando a guardare e identificare le eventuali anomalie nello stesso modo in cui farebbe un dottore”, dice Maringelli: “A quel punto si potranno creare dei sistemi davvero intelligenti e sostitutivi – o integrativi – dello stesso occhio umano”.
A me gli occhi
Questi i campi in cui vengono più frequentemente usate le tecniche di tracciamento oculare
Usabilità di un sito
L’eye tracking viene utilizzato (negli Usa ormai da anni, in Italia solo di recente) per determinare in maniera scientifica l’efficacia di un’interfaccia grafica, che si tratti di un sito Web (esaminandone l’usabilità da parte dell’utente), così come di una pagina pubblicitaria. Nei centri di Sr Labs, per esempio, vengono realizzati test con utenti-campione per valutare in che modo l’attenzione dell’osservatore si distribuisce tra i singoli elementi e quali tra questi catturano maggiormente l’attenzione, ma anche sulla leggibilità dei testi (per sapere se un testo viene letto o meno), sul marchio (per scoprire quanto un brand o un logo all’interno di un messaggio attiri l’attenzione).
Selezione del personale
I test sulla ‘performance visuo-attentiva’ sono stati ideati da Sr Labs per la selezione del personale, in particolare dei cosiddetti ‘mission critical profile’ (piloti, forze di sicurezza, sportivi). In Italia questa tecnica di selezione è stata testata e applicata all’interno di alcune squadre dei Vigili del Fuoco e di altri corpi paramilitari. Il test di Antisaccade, in particolare, misura l’efficienza dei processi di inibizione di comportamenti automatizzati e di routine. Il test Visual Search misura invece il livello di efficienza nella ricerca e identificazione di un target all’interno di uno scenario.
Disabili
Sviluppata congiuntamente dalla svedese Tobii e Sr Labs, I-ABLE/My Tobii (foto a sinistra) è la soluzione che consente a persone disabili di controllare un computer solo con gli occhi (e, opzionalmente, con la voce) in modo da poter comunicare con il mondo esterno con un affaticamento minimo. Grazie ad esso è possibile navigare su Internet, redarre testi e e-mail, produrre parlato (ove non più possibile) attraverso un sintetizzatore vocale e accedere a una serie di applicazioni ‘entertainment’ (video, musica, tv).
Domotica
Nell’ambito di un progetto realizzato per il Fraunhofer Institute, Sr Labs ha realizzato una consolle che consente, con un semplice sguardo, di controllare le luci di casa, il riscaldamento, la centralina di allarme e altre apparecchiature collegate al sistema. Il gruppo internazionale e interdisciplinare di superesperti meglio noto come ‘Gaze-Based Interaction Group’ messo in piedi dal dipartimento di Computer science dell’Università finlandese di Tampere.
Realtà virtuale in 3D
C’è già chi sta pensando di utilizzare tecniche di tracciamento oculare anche all’interno di simulazioni virtuali tridimensionali. In questo caso l’eye tracker servirebbe per ‘volare’ con il proprio avatar fino al luogo desiderato all’interno delle ambientazioni virtuali semplicemente fissando lo sguardo sull’obiettivo. Fra i primi a creare prototipi utilizzabili in sistemi di realtà virtuale a scopo ludico o professionale (soprattutto nell’ambito della formazione a distanza) c’è il team capeggiato da Arie. E Kaufman presso il dipartimento di Computer Science della State University di New York.
Videogames
Scoprire da dove arriva la potenziale minaccia, individuare l’obiettivo nemico, spostare la scena a destra o a sinistra rispetto allo schermo. Ma anche puntare alla roulette o servirsi da soli le carte da un mazzo di carte da poker digitale. E tutto questo fatto solo utilizzando i propri occhi. Saranno i videogames ad aprire le porte dell’eye tracking al grande pubblico: perlomeno questo è quello che pensano alla LC Technologies di Fairfax, in Virginia, dove hanno messo a punto Eyegaze, una tecnologia di tracciamento oculare che, con solo piccoli accorgimenti, può venire adattata a giochi di ruolo o di strategia, giochi di carte o di scacchi.
Packaging di prodotti
L’eye tracking è l’unico test in grado di valutare scientificamente l’impatto di un prodotto nel contesto reale dello scaffale. L’impatto è la combinazione di due distinti fattori: la visibilità, ovvero la capacità di un certo prodotto di ‘farsi notare’ rispetto agli altri, e la riconoscibilità, intesa come la facilità di reperimento del prodotto stesso una volta maturato un interesse da parte del consumatore. I test di eye tracking sono quindi significativi per tutte le decisioni relative al design del package di prodotto.