Alexa d’Amazon devrait recevoir une mise à niveau majeure qui alignera davantage ses capacités conversationnelles sur les chatbots modernes comme Google Bard ou ChatGPT d’OpenAI, a annoncé Dave Limp, vice-président directeur des appareils et services d’Amazon, lors de l’événement Appareils 2023 de l’entreprise mercredi. L’assistant numérique de longue date sera bientôt piloté par un grand modèle de langage spécialement conçu qui sera disponible dans presque tous les nouveaux appareils Echo.
« Notre dernier modèle a été spécialement optimisé pour la voix », a déclaré Limp à la foule rassemblée, « et pour les choses que nous savons que nos clients aiment – comme avoir accès à des informations en temps réel, contrôler efficacement leur maison intelligente et tirer le meilleur parti de leur divertissements à domicile. »
Amazon n’est lui-même pas étranger à la technologie genAI, ayant passé plus d’une décennie à rechercher ses systèmes d’« intelligence ambiante ». Les modèles d’IA générative, en particulier Alexa Teacher, pilotent depuis longtemps les fonctions d’arrière-plan des appareils Alexa. « Avec l’IA générative à notre portée, nous avons commencé à doubler la taille de la maison il y a environ neuf ans, et nous avons eu une révélation », a déclaré Limp. « Nous avons réalisé que tous les investissements en R&D dans l’industrie de l’électronique grand public étaient canalisés vers les téléphones mobiles. Les SOC, les écrans, les jeux de puces, les capteurs étaient optimisés pour le téléphone. »
« C’était compréhensible », a-t-il concédé. « C’est une industrie qui rapporte plusieurs milliards de dollars par an. Mais en même temps, l’endroit où vous passez la grande majorité de votre vie – votre maison – a été pratiquement oublié. »
Le nouveau modèle sera à la fois « plus vaste et plus généralisé », a déclaré Limp, et « nous aidera à franchir les prochaines étapes vers une expérience client remarquablement différente ». À cette fin, Amazon a décidé de concevoir le LLM sur la base de cinq fonctionnalités fondamentales, puis d’ajuster le modèle spécifiquement pour les applications vocales plutôt que pour les écrans mobiles.
1. Conversation : Nous avons étudié ce qu’il faut pour avoir une bonne conversation au cours des neuf dernières années. Ce ne sont pas que des mots ; c’est le langage corporel, c’est comprendre à qui on s’adresse, c’est le contact visuel et les gestes.
2. Applications du monde réel : Alexa vit dans le monde réel, pas dans l’onglet de votre navigateur. Et l’un des défis non résolus de ces LLM est de savoir comment ils interagissent avec les API et font ce qu’il faut.
3. Personnalisation : Le LLM à domicile doit être personnalisé en fonction de vous et de votre famille.
4. Personnalité : « Nous avons toujours dit que le dîner le plus ennuyeux est celui où personne n’a d’opinion, et Alexa, propulsée par ce LLM, aura des opinions – et elle aura certainement toujours les blagues et les œufs de Pâques que vous avez venez aimer d’Alexa.
5. Confiance : Pour construire une IA qui tiendra ses promesses, nous avons besoin à la fois de fiabilité et de performance. « J’ai l’une des maisons les plus Alexa du monde et je n’apporterais rien dans ma maison qui, à mon avis, compromettrait la vie privée de ma famille. »
Les optimisations vocales signifient simplement que vous n’aurez pas à répéter Alexa à chaque fois que vous lui parlez. Les clients inscrits au système Visual ID de l’entreprise n’auront qu’à se placer face à l’écran avant de commencer à parler. De plus, la nouvelle Alexa sera plus indulgente envers les trébuchements ou les discours remplis de pauses, et elle modulera bientôt son ton et ses émotions en fonction du contexte de la conversation.
Le LLM sera également « connecté à des centaines de milliers d’appareils et de services du monde réel via des API », indique le communiqué de la société. « Cela améliore également la capacité d’Alexa à traiter les nuances et les ambiguïtés, un peu comme le ferait une personne, et à agir intelligemment. » Ainsi, les utilisateurs pourront bientôt programmer des requêtes complexes, comme « Alexa, tous les soirs de la semaine à 21 heures, annonce que c’est l’heure de coucher les enfants, tamise les lumières à l’étage, allume la lumière du porche et allume le ventilateur dans l’appartement ». la chambre », le tout en utilisant uniquement des commandes vocales.
Limp a tenté de montrer ses capacités naturelles de conversation lors d’une démonstration sur scène mercredi, mais Alexa n’a pas été particulièrement coopérative, ignorant manifestement deux des invites vocales de Limp qui l’obligeaient à se répéter timidement.
Le nouveau modèle est loin d’être le seul projet genAI d’Amazon. La société a récemment publié un modèle génératif pour aider ses vendeurs de commerce électronique à rédiger des listes de produits et a incorporé une multitude de fonctionnalités basées sur l’IA dans ses émissions de football du jeudi soir au début de la saison de la NFL. La société a également résisté aux critiques de la Writers Guild of America concernant l’autorisation accordée par le détaillant aux listes de livres générées par l’IA qui portent gravement atteinte aux œuvres protégées par le droit d’auteur (et recommandent parfois de manger des champignons suspects).
Le nouveau LLM sera disponible pour les propriétaires d’Echo existants dans le cadre d’un aperçu gratuit sur les appareils qu’ils possèdent déjà ainsi que sur chaque nouvel appareil Echo vendu, à partir de 2024.
Suivez toute l’actualité en direct de l’événement Amazon Devices 2023 ici.