Les assistants vocaux basés sur le cloud sont-ils condamnés ? Cela semble être une question trop dramatique à poser si vous regardez l’état actuel de millions d’utilisateurs de Google Assistant, d’Amazon Alexa et de Siri d’Apple, mais nous ne sommes pas si sûrs de l’avenir. Google et Amazon ont récemment abandonné leurs assistants vocaux, Amazon licenciant une grande partie de l’équipe Alexa en raison de la perte de 10 milliards de dollars par an. Google n’en est pas tout à fait au stade du « licencier tout le monde », mais il serait moins intéressé par la prise en charge de l’assistant sur des appareils tiers, ce qui serait une décision paralysante compte tenu de la très petite division matérielle de Google. Tout le monde a construit ces systèmes en supposant qu’un flux de revenus viendrait plus tard, mais ces revenus ne sont jamais venus, et il semble que la bulle éclate.
Un projet qui dépend fortement des assistants vocaux Big Tech n’est pas assis et n’attend pas l’apocalypse. L’équipe de Home Assistant déclare 2023 « l’année de la voix de Home Assistant ». Il s’agit essentiellement du principal projet de maison intelligente disant : « Si ces assistants vocaux cloud ne fournissent pas à Big Tech un flux de revenus de plusieurs milliards de dollars, c’est très bien, nous le ferons nous-mêmes ! » Il existe déjà quelques projets d’assistant vocal open source naissants, mais l’équipe Home Assistant a prouvé qu’elle pouvait gérer un gros projet. Il a une communauté énorme et prospère et suffisamment de revenus pour avoir des employés à temps plein, ce qui en fait le nouveau chef de file pour un service vocal local viable.
De plus, Home Assistant ne part pas de zéro – il est allé chercher ce qu’il a appelé l’assistant vocal open source « le plus prometteur », « Rhasspy », et a embauché le développeur principal, Mike Hansen, pour travailler à plein temps sur la voix dans Assistante à domicile. Hasen travaillera désormais chez Nabu Casa, la société de commercialisation de Home Assistant. Selon le fondateur de Home Assistant, Paulus Schoutsen, « Rhasspy se démarque des autres projets vocaux open source car Mike ne se concentre pas uniquement sur l’anglais. Au lieu de cela, son objectif est de le faire fonctionner pour tout le monde. différentes langues aujourd’hui. » Le plan est de prendre en charge les 62 langues actuellement prises en charge par Home Assistant, mais avec la voix, le tout sans avoir besoin d’une connexion Internet.
Schoutsen dit que Home Assistant gardera la portée du projet « gérable » pour l’instant et va « limiter le nombre d’actions possibles et se concentrer sur les bases de l’interaction avec votre maison intelligente. Pas de recherches sur le Web, d’appels ou de jeux vocaux. » Bien sûr, il y aura probablement un moyen pour la communauté Home Assistant d’ajouter des fonctionnalités supplémentaires, puis elle gonflera rapidement pour imiter Hal 9000 et faire un million d’autres choses supplémentaires.
Le problème avec tous ces services vocaux Big Tech est qu’ils n’ont aucun moyen de générer des revenus continus. Ils n’ont pas vraiment de moyen de diffuser des publicités et personne ne veut d’un autre service d’abonnement. Cependant, ils génèrent un coût permanent en raison du temps de serveur nécessaire pour traiter toutes ces communications vocales. Google et Amazon ont exacerbé le problème en vendant leur matériel vocal au prix coûtant dans le but de gagner la ruée vers les assistants vocaux, tout en espérant qu’une source de revenus supplémentaire viendrait plus tard. Apple a lancé un haut-parleur Siri haut de gamme, le HomePod, en 2018 à un prix alors choquant de 350 $, mais rétrospectivement, cela semble beaucoup plus durable que ce que faisaient Amazon et Google.
Google a apparemment tenté de résoudre ce problème avec ses haut-parleurs vocaux de deuxième génération, qui ont déplacé « certains » traitements vocaux vers des puces locales. Déplacer une partie du traitement de la voix hors du cloud réduira le temps du serveur, mais il n’est pas clair si cela suffit pour répondre aux normes incroyablement élevées de Google en matière de support produit continu.
Le déplacement d’un assistant vocal dans un environnement d’hébergement vous permet de payer ces coûts à un taux raisonnable (une sorte de matériel pour démarrer, puis juste la facture d’électricité) sans avoir à vous soucier des priorités étranges et changeantes d’un Big Tech écosystème. Il y aura probablement un tas d’autres avantages aussi. Un assistant vocal local serait idéal pour la confidentialité, et vous aurez moins l’impression d’être en train d’écouter une écoute téléphonique Internet en permanence dans votre maison 24h/24 et 7j/7. Home Assistant a également prouvé que la conservation de tous ces résultats locaux dans une expérience beaucoup plus rapide pour votre maison intelligente, et Google a dit la même chose à propos de son traitement vocal local limité.
L’assistant domestique dispose déjà d’un système de commande « Conversation » en texte uniquement, il s’agit donc de le construire et de le connecter à l’entrée et à la sortie vocales. Ce qui n’est pas clair à ce sujet, c’est la solution matérielle au-delà de la « pile de fils et de circuits imprimés » habituelle qui domine généralement les projets de maison intelligente open source. Une partie de ce qui rend l’Assistant Google et Alexa si populaires est une sélection de superbes combos haut-parleur/microphone que vous pouvez répartir dans la maison sans ressembler à un scientifique fou. La société de commercialisation de Home Assistant, Nabu Casa, s’est récemment efforcée de combler cette lacune matérielle, en fabriquant des boîtiers et des dongles de serveur plug-and-play pour apporter des éléments tels que la prise en charge de Matter dans l’écosystème Home Assistant. Peut-être que cela pourrait lancer un haut-parleur.