Le secret derrière les sons d’alerte d’Amazon Echo

« Alexa ? »

Si vous possédez un Amazon Echo, il est possible que la simple lecture de ce mot déclenche un «bimm» pavlovien dans votre esprit. Ou, si vous avez désactivé le son de réveil, c’est peut-être l’alarme de la minuterie qui vous fait trembler si vous l’entendez dans une émission de télévision (ou quelqu’un d’autre conférencier). Quoi que vous pensiez des sons émis par une enceinte intelligente, aucun d’entre eux n’est accidentel. Ils ont tous été méticuleusement conçus pour attirer votre attention ou vous rassurer, selon leur objectif. Et l’écho pouvait ont semblé très différents de ce que nous connaissons aujourd’hui.

La série Echo, en particulier, a joué un rôle déterminant dans la définition du haut-parleur intelligent et des sons que nous attendons et (pour éviter la pizza brûlée) dont nous avons besoin. Peut-être que vous ne pensez pas beaucoup à ces panneaux acoustiques transitoires – les bips et les boops qui limitent les réponses verbales d’Alexa – et ça va, c’est aussi par conception. En fait, Chris Seifert, Senior Design Manager chez Amazon, ne verrait pas d’inconvénient à ce que vous ne remarquiez pas du tout ces sons.

« L’une des choses que les gens disent souvent à propos du son, c’est que vous n’en entendez parler que lorsqu’il est mauvais », a déclaré Seifert à Engadget. « Les gens ne vont pas à une pièce de théâtre et disent à quel point le son était génial, [it] n’était probablement pas un bon jeu, si c’est ce sur quoi vous vous concentrez.

C’est pourquoi, lorsque vous fais prononcez le mot de réveil magique, Alexa répond exactement comme elle le fait. Ce « bimm » pourrait sembler comme un son d’alerte générique et soigné, mais il a été délibérément conçu de cette façon. Seifert, la première personne employée par Amazon pour créer la conception sonore d’Echo, a estimé que pour que les utilisateurs soient à l’aise avec un haut-parleur intelligent, toutes les interactions – pas seulement les réponses orales d’Alexa – devaient se sentir naturelles et en contexte. « Si nous n’utilisons que du skeuomorphisme et uniquement des sons du monde réel, c’est un peu étrange, dans une expérience purement numérique », a-t-il déclaré.

Amazone

C’est un concept que Seifert appelle «la familiarité abstraite». Vous le savez, mais vous ne savez pas pourquoi vous le savez. Et il n’y a pas de meilleur exemple de cela que le son de réveil d’Alexa, qui est basé sur le « uh-huh » omniprésent et très humain. Un son que l’on peut entendre des dizaines de fois par jour. Un son qui nous permet de savoir que quelqu’un écoute sans que nous nous sentions interrompus.

« Nous avons pris des enregistrements de personnes disant cela et nous les avons analysés et avons examiné la fréquence d’utilisation, le temps qu’ils prenaient généralement et leur niveau sonore par rapport à leurs réponses vocales normales réelles », a déclaré Seifert. « Et puis nous avons recréé cela, essayé beaucoup d’instruments différents. Certains d’entre eux, des instruments du monde réel, certains d’entre eux complètement synthétiques, et ont trouvé cette combinaison de tout ce qui précède pour créer ce que nous appelons notre son de réveil.

Si vous avez un appareil Alexa à proximité, allez-y et essayez-le. Ce son court est aussi curieusement pratique. Vous constaterez peut-être que la façon dont vous y réagissez est différente de celle de quelqu’un d’autre. Personnellement, j’ai d’abord toujours attendu le son, puis j’ai émis ma commande. Il s’avère que j’ai peut-être été un peu trop poli. Seifert m’informe qu’il a été conçu pour que vous n’ayez pas besoin d’attendre, vous pouvez en parler avec plaisir. Encore une fois, ce n’est pas un hasard.

« J’adore ce sujet, car l’intérêt de la technologie est qu’elle devrait fonctionner pour vous, n’est-ce pas ? dit Seifert. « Même vous savez, pendant la journée, je pourrais dire, ‘Alexa, quelle heure est-il ?’ tout en une phrase, non? Parce que je suis juste à côté de l’appareil, il suffit de le débiter. Si je pense à une question plus large, avant de commencer cette longue chose, je pourrais en fait faire une pause pour m’assurer d’être entendu parce que je suis à mi-chemin dans le couloir. Et je ne veux pas avoir à tout répéter s’il ne m’a jamais entendu.

Si vous vous êtes déjà demandé ce que ce bruit de réveil pouvait ont sonné comme dans un univers alternatif ou avec certains des vrais instruments, alors vous pouvez les entendre dans l’audio intégré ci-dessous.

Une bonne conception sonore est un exercice du rasoir d’Occam : comment créer un retour informatif et approprié dans un ton qui dure peut-être moins d’une demi-seconde ? Nous connaissons tous le redouté ou peut-être le satisfaisant. Les alertes laconiques et non clés enflamment la frustration tandis que le carillon net d’une tâche terminée se sent juste droit. Mais s’agit-il simplement de choisir quelque chose qui sonne positif ou négatif ?

Pas si le son de réveil Echo est une indication. Mais parfois, Seifert et son équipe ont le luxe d’avoir un peu plus de souffle sonore. Comme le son de démarrage de l’Echo qui dure neuf secondes. L’équivalent audio de War and Peace en termes de conception sonore de l’interface utilisateur. Mais aussi, le tout premier son que tout propriétaire d’Echo va entendre, donc ça doit compter. Encore plus en 2014.

« Nous faisions un haut-parleur auquel vous avez parlé et que nous tenons maintenant totalement pour acquis », a déclaré Seifert. «À l’époque, c’était vraiment une nouveauté, comme si vous alliez juste parler de cet appareil, vous n’avez littéralement pas à le toucher de quelque manière que ce soit. Alors, comment encourageons-nous les gens à se sentir à l’aise de faire quelque chose de si nouveau, que ce n’est tout simplement pas prévu ? »

Seifert a ensuite expliqué comment ils devaient créer des attentes pour tout ce qui allait arriver. Ils avaient besoin d’un son qui indiquerait que cet appareil sans écran s’allumait pour la première fois et qu’à la fin de ces neuf secondes vitales, Alexa vous écoutait et vous attendait. Le résultat est un son de pad qui crée un peu de suspense avant de se décomposer en trois notes ascendantes qui nous amènent directement au premier mot d’Alexa : Hello.

Ces trois notes comprennent également le son de réveil (deux au réveil, la troisième vient plus tard dans ce qu’on appelle une tonalité de «pointage final»). Oh, et la sonnerie d’appel entrant utilise ces trois notes et en ajoute deux autres pour le plaisir. En fait, à peu près tous les signaux non verbaux de l’Echo se résument à ces trois notes à un certain niveau. Juste placés dans des ordres, des hauteurs et des longueurs différents selon qu’ils veulent votre attention, l’ont déjà ou n’en ont plus besoin.

Un trio de différents haut-parleurs Amazon Echo

Elaine Thompson / Presse associée

« À partir du moment où vous démarrez votre appareil, vous entendez ces trois notes. Lorsque vous lui parlez, vous en entendez deux avant de parler et un à la fin, lorsque vous recevez un appel entrant, vous obtenez une version à cinq notes de cette mélodie. Seifert a expliqué. « Tout cela se passe avant que la partie logique du cerveau n’entre en jeu, et vous commencez à interpréter ce que vous entendez et à en penser la signification. » En bref, ils jouent avec nos esprits et nous n’en sommes même pas fous. Si vous n’êtes toujours pas convaincu, vous le serez peut-être lorsque vous apprendrez que ces trois tonalités récurrentes sont censées ressembler à quelqu’un qui dit « Am-a-zon ».

Mais il y a une petite chose que Seifert et son équipe n’ont pas encore réussi à résoudre : la personnalisation. En ce qui concerne nos appareils individuels, nous pouvons changer et choisir les sons qu’ils émettent, mais un écho est souvent communautaire, faisant partie de la maison partagée. Comment permettre un certain niveau de personnalisation tout en maintenant la compréhension omniprésente d’un « uh-huh ? »

Selon Seifert, c’est le prochain grand défi au pays des haut-parleurs intelligents. « La prochaine étape consiste à faire en sorte que toutes ces expériences soient personnalisées, mais qu’elles soient toujours comprises par un groupe collectif. » Mais il reste également discret, pour l’instant, sur la façon dont cela pourrait réellement fonctionner. « Je pense que nous verrons une grande partie de l’avenir va avoir plus de personnalisation et de personnalisation […] et c’est le défi parce qu’avant Alexa et Echo, la plupart des sons étaient faits, vous savez, un à un.

Tous les produits recommandés par Engadget sont sélectionnés par notre équipe éditoriale, indépendante de notre maison mère. Certaines de nos histoires incluent des liens d’affiliation. Si vous achetez quelque chose via l’un de ces liens, nous pouvons gagner une commission d’affiliation.

Source-145