samedi, novembre 9, 2024

Ai Pin de Humane de près

Quelques heures après le grand dévoilement de ce matin, Humane a ouvert ses portes à une poignée de presse. Situé dans un bâtiment quelconque du quartier SoMa de San Francisco, le bureau abrite les équipes de conception matérielle de la startup.

Un bureau voisin abrite les ingénieurs produits de Humane, tandis que l’équipe d’ingénierie électrique opère depuis un troisième espace juste de l’autre côté de la rue. La société exploite également un bureau à New York, même si la majeure partie des 250 collaborateurs se trouve ici, à San Francisco.

Aujourd’hui, une grande partie de l’espace est occupée par une série de stations de démonstration (avec une politique stricte d’interdiction de filmer), où différents Ai Pins sont disposés dans divers états de déshabillage, exposant leurs machinations extérieures. Cependant, avant d’y assister, les cofondateurs de Humane se tiennent devant un petit groupe de chaises, flanquant un écran plat qui présente la vision de l’entreprise.

La PDG Bethany Bongiorno donne un bref historique de l’entreprise, en commençant par la façon dont elle a rencontré le co-fondateur et président Imran Chaudhri lors de son premier jour chez Apple. Toute l’histoire de l’entreprise remonte à son ancien employeur. C’est là qu’ils ont débauché le directeur technique Patrick Gates, ainsi qu’environ 90 autres anciens Applers.

Crédits images : Brian Chauffage

Pour sa part, Chaudhri décrit l’histoire de l’entreprise comme une courbe en S – des cycles technologiques de 15 ans qui constituent la base et finalement cèdent la place à l’avenir. « La dernière époque a atteint un plateau », dit-il à la salle, affirmant que le smartphone a « 16 ans » – bien que cela semble aussi être un clin d’œil à ses anciens employeurs, dont le premier iPhone est arrivé en 2007.

Il présente le premier produit de Humane comme « une nouvelle façon de penser, un nouveau sentiment d’opportunité ». Il s’agit, ajoute-t-il, d’un effort visant à « produire l’IA ». La présentation en personne est décidément plus fondée que ce que les vidéos précédentes pourraient laisser croire. Il est vrai que les déclarations sont toujours grandioses et radicales, contextualisant l’appareil porté sur le revers comme la prochaine étape d’un voyage informatique qui a commencé avec des ordinateurs centraux de la taille d’une pièce, mais la conversation devient un peu plus pragmatique lorsque l’appareil est présenté devant nous.

L’appareil de la taille d’une boîte d’allumettes est doté d’un processeur Snapdragon et de 32 Go de stockage local. La caméra est un capteur de 12 mégapixels conçu pour un smartphone mais intégré au module propre à Humane. Il y a un accéléromètre et un gyroscope ainsi qu’un capteur de profondeur et de temps de vol. Comme les produits Apple, il est conçu en Californie et principalement fabriqué en Asie.

La majorité de l’extérieur de l’appareil est monopolisée par un écran tactile qui abrite la majorité des composants embarqués et une batterie qui devrait durer quatre ou cinq heures avec une charge. Au-dessus, une sorte de barre de caméra abrite les capteurs ci-dessus, ainsi que le système de projection laser – de loin l’aspect le plus saisissant visuellement de toute l’affaire. La barre de la caméra est inclinée vers le bas. Humane dit avoir testé l’épingle sur une variété de types de corps différents et avoir opté pour un design qui s’adapte aux utilisateurs ayant une poitrine plus grande.

L’entreprise m’a également dit qu’elle avait testé la projection laser avec un spectre de différentes nuances de peau, pour s’assurer qu’elle serait visible. Bien qu’elles soient visuellement saisissantes, les projections sont considérées comme un élément secondaire par rapport à ce qui est essentiellement un produit axé sur la voix. Si, toutefois, vous vous trouvez dans un environnement trop bruyant ou trop calme pour accueillir le petit haut-parleur orienté vers le haut qui longe le haut de l’appareil, appuyez sur le pavé tactile et la caméra se met au travail à la recherche d’un coup de main. Une fois repéré, il commence à se projeter.

Crédits images : Brian Chauffage

Chaudhri a démontré cette fonctionnalité lors d’une conférence TED en mai. Une minute ou deux plus tard, un appel mis en scène arrive de Bongiorno, que l’épingle projette sur sa paume sous forme de texte. De là, il peut appuyer sur sa paume pour accepter ou refuser l’appel, le système identifiant le mouvement et agissant en conséquence.

Les lasers peuvent cependant en afficher bien plus. Ils affichent le texte des messages, que vous pouvez parcourir d’un geste de pincement de la même main. Ils peuvent même afficher des aperçus rudimentaires des images que vous prenez, même si le laser vert ne fait pas le meilleur travail possible pour mettre en valeur les subtilités subtiles d’une photo.

L’AI Pin a un peu de poids, bien que cela soit quelque peu compensé par le « booster de batterie » fourni dans la boîte, portant la durée de vie complète de la batterie à environ neuf heures. Le produit est également livré avec un étui en forme d’œuf qui ajoute une autre charge complète au produit. Vous pouvez y glisser soit la broche, soit le booster, soit les deux, et ils s’enclencheront magnétiquement. La charge s’effectue via une série de broches à l’arrière de l’appareil. La boîte contient également un chargeur pour un usage domestique.

Bongiorno a confirmé les rapports antérieurs faisant état d’un premier lot de 100 000 unités. «Je pense que, comme pour chaque démarrage de matériel informatique, nous voulons nous assurer de planifier de manière prudente pour tous les scénarios», dit-elle. « Pour nous, au début, il s’agissait vraiment de déterminer quelle était la chose conservatrice, juste et responsable à faire, en termes de demande et de nous permettre une option si notre demande dépasse 100 000. »

Elle ajoute que, hier, plus de 110 000 personnes s’étaient inscrites pour attendre – bien que ce nombre soit davantage une indication de curiosité que de véritables projets d’achat, car aucun dépôt n’est requis. La liste est également mondiale, alors que l’appareil n’est disponible en précommande qu’aux États-Unis, où il sera mis en vente « au début de l’année prochaine ». Le groupe initial sur la liste d’attente bénéficiera d’un « accès prioritaire » pour acheter le produit.

Crédits images : Brian Chauffage

Le cœur de l’appareil est l’IA. Il s’agit de l’un des premiers produits matériels à surfer sur la vague actuelle d’enthousiasme autour de l’IA générative, mais ce ne sera certainement pas le dernier. Le nom de Sam Altman est étroitement lié à la startup depuis le jour de son annonce. Je demande dans quelle mesure Altman et OpenAI ont été impliqués dans la création du produit.

« Sam a dirigé notre Série A en 2020. Imran a été très clair sur le fait que Sam était la cible de la Série A et voulait vraiment qu’il s’implique », explique Bongiorno. « Je pense qu’il y avait beaucoup de respect mutuel et d’enthousiasme à propos de ce que nous croyions tous être l’avenir en termes d’informatique. Il a été un incroyable défenseur et partisan de nous, et il répond au téléphone chaque fois que nous avons besoin de conseils et d’orientations. Nous travaillons avec l’équipe OpenAI. Notre équipe d’ingénierie a collaboré et travaillé en étroite collaboration.

Selon Chaudhri, GPT est l’un des nombreux LLM exploités par le système. Il a également confirmé que GPT-4 fera partie des instances utilisées par le système. En fin de compte, cependant, les systèmes d’IA précis exploités pour une tâche donnée sont quelque peu obscurs de par leur conception. Ils sont accessibles au cas par cas, en fonction de la détermination par l’épingle du plan d’action approprié.

Cela s’applique également aux requêtes basées sur le Web. Le système explore une variété de moteurs de recherche et de ressources différents comme Wikipédia. Certains seront des partenaires de contenu officiels, d’autres non. Jusqu’à présent, les partenaires sont limités. Il existe OpenAI et Microsoft, ainsi que Tidal, qui sert d’application musicale par défaut du système. Un exemple donné lors d’une de nos démos était « jouer de la musique produite par Prince », plutôt que le plus simple « jouer à Prince ».

« Une partie de notre IA est propriétaire. Nous construisons nos propres IA, puis nous exploitons des éléments tels que GPT et les modèles d’OpenAI », explique Bongiorno. «Nous pouvons ajouter des LLM et de nombreux services d’autres personnes, et notre objectif est d’être la plate-forme pour tout le monde et de permettre l’accès à de nombreuses expériences et services d’IA différents, de sorte que le modèle commercial est structuré de manière à nous permettre pour faire ça. Et je pense que nous réfléchirons à différents modèles de revenus que nous pouvons également ajouter et à différentes sources de revenus sur la plateforme.

Crédits images : Brian Chauffage

L’objectif est de rendre l’expérience transparente, à la fois en termes de ce qui se passe en back-end avec les LLM et en termes de recherches et de mises à jour sur le Web. Le système est conçu pour diffuser continuellement des mises à jour et ajouter de nouvelles fonctionnalités en arrière-plan. Il utilise également un contexte supplémentaire, notamment les questions récemment posées et la localisation, à l’aide du GPS embarqué.

Les photos constituent également une grande pièce du puzzle. La caméra embarquée possède un ultra grand angle avec un champ de vision de 120 degrés. Il n’y a pas de mise au point automatique en jeu – c’est plutôt une distance focale fixe. Dans les lumières des bureaux de SF, au moins, les photos paraissaient solides. Il y a une bonne partie de la photographie informatique qui se produit sur les appareils, notamment pour déterminer si la broche est de niveau lors de la prise de vue et orienter l’image finale en conséquence.

Tout semble encore très précoce ici, mais il est clair que beaucoup de soin (et d’argent) ont été consacrés au produit. La demande est peut-être ici le plus grand point d’interrogation. Humane a-t-il vraiment trouvé une application qui tue ? Pour les fabricants de montres intelligentes, la santé est depuis longtemps la réponse. Mais le suivi de la santé joue ici un rôle considérablement réduit.

Le produit n’entre pas en contact direct avec la peau de l’utilisateur, de sorte que les mesures de santé qu’il est capable de collecter sont limitées au-delà de son rôle de podomètre – bien que cette fonctionnalité ne soit pas non plus prise en charge actuellement. La plus grande fonctionnalité liée à la santé à l’heure actuelle est le comptage des calories, vous indiquant spécifiquement combien de calories et d’autres informations nutritionnelles se trouvent dans le morceau de nourriture que vous tenez devant la caméra, à l’aide d’une plate-forme tierce d’identification des aliments sans nom.

Crédits images : Brian Chauffage

Le prix sera certainement un obstacle pour un appareil non éprouvé : 699 $, ce n’est fondamentalement rien par rapport aux normes des smartphones, mais c’est beaucoup demander pour un produit de première génération et un nouveau facteur de forme. Les 24 $ supplémentaires par mois n’aident pas non plus, même si Bongiorno ajoute : « Vous obtenez un numéro de téléphone ; vous bénéficiez d’appels, de SMS et de données illimités ; vous recevez autant de requêtes d’IA que vous le souhaitez, en plus de tous nos services d’IA. Aujourd’hui, nous voyons à quel point il y a un engouement autour de ChatGPT, où les gens paient déjà pour y avoir accès.

Cependant, si vous ne payez pas ce mois-là, le produit est en fait un presse-papier jusqu’à ce que vous commenciez l’abonnement.

Avant la fin de notre séance, je demande à Chaudhri comment l’entreprise a atterri sur le revers, surtout lorsque les affichages sur la tête sont considérés comme la valeur par défaut depuis un certain temps. Certes, son ancien employeur Apple parie sur la face avec son prochain Vision Pro.

« Le calcul contextuel a toujours été considéré comme quelque chose que l’on doit porter sur son visage », dit-il. « Il y a juste beaucoup de problèmes avec ça. Beaucoup de gens portent des lunettes que l’on met pour une raison bien précise. C’est soit pour vous aider à voir, soit pour protéger vos yeux. C’est une décision très personnelle : la forme de votre cadre, le poids de votre cadre. Tout cela se résume à quelque chose d’aussi unique que vous. Si vous regardez la puissance du contexte, et que c’est là l’obstacle à la réalisation du calcul contextuel, il doit y avoir une autre solution. Nous avons donc commencé à chercher quelle est la pièce qui nous permet d’être beaucoup plus personnels ? Nous sommes arrivés à l’idée que nous portons tous des vêtements, alors comment pouvons-nous orner nos vêtements d’un appareil qui nous donne un contexte ? »

Source-146

- Advertisement -

Latest