Publié le 19/02/2016
Tous les auteurs de science-fiction en ont rêvé, le projet VoiceHome va le réaliser. Il développe un système de réception et d’analyse du son pour pilotage domotique en langage naturel, où que l’on soit dans la maison.
C’est le principal défi à relever pour VoiceHome : mettre au point un système de réception et d’analyse du son qui soit capable d’interpréter la voix à distance, sans exiger d’efforts particuliers de la part de l’utilisateur. Pas de bouton sur lequel appuyer ou de micro dans lequel parler, ni même de grammaire à respecter ; le dispositif doit être capable de faire le tri entre le bruit ambiant et la parole prononcée dans l’intention de commander un équipement.
Une seule contrainte : un mot-clé prononcé en début de phrase signale qu’il s’agit d’une commande. “C’est ce qu’on appelle un wake-up word”, explique le coordinateur du projet, Éric Lamandé. “Nous avons choisi un mot qui pourra être détecté avec une grande fiabilité par le système, ce qui évite de déclencher une interaction de manière intempestive. Ensuite, l’utilisateur exprime sa commande avec ses propres habitudes de langage. En cas de doute, le système entame un dialogue avec l’utilisateur en synthèse vocale pour lever l’ambigüité.”
Tous les appareils domestiques et multimédias de la maison pourront être pilotés de cette façon : le chauffage, les lumières, le lave-linge, les volets aussi bien que la chaîne haute-fidélité, l’ordinateur ou la télévision. “On pourra régler l’intensité de la lumière ou interroger la météo. Ou encore demander si on a reçu des mails. Nous nous limitons aux interactions simples, car la voix n’est pas adaptée aux informations denses. Par exemple, s’il s’agit de faire un choix dans une liste ou un programme, l’affichage sur écran est beaucoup plus pertinent. L’interaction par la parole intervient alors en complément, dans une approche d’interface utilisateur multimodale.”
Le système est constitué d’un boitier central utilisant le réseau local domestique -Ethernet ou sans fil- pour communiquer avec les équipements de la maison, et d’une ou plusieurs sondes pour la captation du son. L’ensemble est développé par un consortium de huit partenaires : trois industriels susceptibles d’intégrer la solution dans leurs produits, Delta Dore pour la domotique, Technicolor pour le multimédia, Orange pour ses terminaux de communication ; deux fournisseurs de briques technologiques, Telisma*, spécialiste de la reconnaissance vocale, eSoftThings pour la conception de sondes à faible consommation ; et trois laboratoires de recherche, l’Irisa sur le traitement du signal audio, l’INRIA Nancy-Grand-Est pour l’optimisation du modèle d’interprétation acoustique, et LOUSTIC sur le plan des usages. Car la difficulté, c’est aussi de tester les comportements de panels d’utilisateur (notre photo : appartement de test) et d’aboutir à un dialogue efficace et naturel pour commander les équipements.
Pour Éric Lamandé, les interfaces vocales sont aujourd’hui au centre de grands enjeux commerciaux. “Tous les grands noms -Apple, Google- travaillent sur la commande vocale pour la domotique, notamment au moyen de smartphones. L’apport de VoiceHome, c’est de pouvoir le faire sans accessoire particulier. On veut aller plus loin dans l’utilisation courante : pouvoir fermer ses volets ou changer de programme télé même quand on a les mains occupées à une tâche ménagère par exemple. Il faut que la personne se sente à l’aise dès la première utilisation.”
Au-delà de la domotique, tout laisse à penser que les interfaces vocales telles que celles développées par VoiceHome deviendront une technologie clé pour de nombreuses applications : le maintien à domicile de personnes âgées ou handicapées grâce aux possibilités de commande ou d’appel à distance, le pilotage d’un équipement alors que les mains sont occupées ailleurs, par exemple à conduire ou par une tâche de maintenance, l’interaction avec un objet connecté qui ne dispose pas d’interface du type clavier-écran…
Pour tous les partenaires industriels et académiques, le projet VoiceHome est aussi l’occasion “de se positionner”. “Nous cherchons à miniaturiser au maximum la partie reconnaissance vocale de façon à ce qu’elle puisse s’intégrer dans n’importe quel objet, même de très petite taille. L’objectif est d’acquérir une avance technologique car il est clair que les interfaces vocales vont se généraliser.”
(*) L’entité Telisma, basée à Rennes et Lannion, appartenait au groupe indien OnMobile jusqu’en janvier 2016. Elle vient de passer sous pavillon américain en étant rachetée par Voicebox Technologies, et reste leader du projet VoiceHome.
VoiceHome en bref :
- Projet collaboratif labellisé Images & Réseaux (FUI 18)
- Budget global : 5,4 M€
- Aide au financement : BPI France et collectivités locales
- Projet débuté en février 2015 pour une durée de 30 mois