mardi, novembre 19, 2024

Avec Brain.ai, l’IA générative est l’OS

L’Ai humaine Badge et les ordinateurs de poche Rabbit ont suscité beaucoup d’intérêt dans la presse pour leurs approches individuelles d’intégration de l’IA générative avec le matériel. Humane, en particulier, présente son portable comme un regard sur la vie au-delà du smartphone. Cela soulève naturellement la question : quel est précisément le problème avec le smartphone ? S’il est vrai que le format a plafonné, ces appareils sont toujours disponibles dans le monde, entre des milliards de mains.

Plus tôt cette semaine, j’ai rencontré Jerry Yue au milieu du vacarme cacophonique du stand du Mobile World Congress de Deutsch Telekom. Après une démonstration du produit et une conversation assise, j’avoue que je suis impressionné par la vision du fondateur et PDG de Brain.ai (également connu sous le nom de Brain Technologies) pour l’avenir des smartphones. Je n’irai pas jusqu’à dire que je suis pleinement convaincu jusqu’à ce que j’aie eu l’occasion de passer plus de temps avec le produit, mais cela dresse un tableau absolument convaincant de la façon dont l’IA générative pourrait être fondamentale pour la prochaine génération d’appareils.

L’ensemble du « futur des smartphones » est peut-être hyperbolique, mais à tout le moins, je soupçonne que certains des plus grands noms du secteur étudient actuellement la manière dont l’IA générative de première partie constitue efficacement l’épine dorsale du système d’exploitation du produit. Mais même si les compagnies de téléphone voient l’avenir, l’interface peut s’avérer plus floue pour les consommateurs. La mise en œuvre bouleverse le paradigme actuel du système d’exploitation pour smartphone, nécessitant une démonstration pour comprendre pleinement en quoi il est différent et pourquoi il est utile. Même si j’admets que je n’ai pas été complètement convaincu par le terrain, le regarder en action met en évidence son efficacité.

Le système d’exploitation n’est pas totalement déconnecté du système d’exploitation ouvert de Google, mais uniquement dans le sens où il est construit sur le noyau Android. Comme nous l’avons vu lors du développement d’HarmonyOS de Huawei à l’ère Trump, il est tout à fait possible de créer quelque chose de distinct d’Android en l’utilisant comme base. Ici, l’IA générative est plus qu’une simple intégration dans le système, elle constitue le fondement de la façon dont vous interagissez avec l’appareil, de sa réponse et de l’interface qu’il construit.

La notion de « téléphone IA » n’est pas totalement nouvelle. En fait, c’est une phrase que tu vas entendre beaucoup Dans les années à venir. Je vous garantis que vous en aurez marre d’ici décembre. Des éléments d’IA/ML sont intégrés dans les appareils sous une forme ou une autre depuis plusieurs années maintenant. Entre autres choses, cette technologie est fondamentale pour la photographie informatique, c’est-à-dire le traitement des données collectées par le capteur de l’appareil photo qui se produit sur la puce.

Cependant, plus tôt ce mois-ci, Samsung est devenue l’une des premières grandes entreprises à vraiment se pencher sur la notion de « téléphone IA ». La distinction ici est l’arrivée de l’IA générative – la technologie derrière des programmes comme Google Gemini et ChatGPT. Encore une fois, une grande partie de l’intégration se produit du côté de l’imagerie, mais elle commence également à s’étendre à d’autres aspects.

Crédits images : Brian Chauffage

Compte tenu de l’ampleur de l’investissement de Google dans Gemini, il va de soi que cette tendance ne fera que s’accentuer dans les années à venir. Apple entrera également dans cette catégorie plus tard cette année. Je ne qualifierais pas encore l’IA générative de révolutionnaire sur ces appareils, mais il est clair que les entreprises qui ne l’adoptent pas maintenant vont être laissées pour compte dans les années à venir.

L’utilisation de la technologie par Brain.ai va beaucoup plus loin que les autres implémentations actuelles. D’un point de vue matériel, il s’agit cependant d’un smartphone standard. En fait, l’accord Deutsch Telecom qui a permis à Yue d’exposer sur le stand chargé de magenta signifie que le système d’exploitation verra initialement le jour via l’appareil connu sous le nom de T-Mobile REVVL ici aux États-Unis (connu sous le nom de « T Phone » sur les marchés internationaux comme l’UE). Le modèle précis, la date de sortie et la nature de l’accord seront révélés « bientôt », selon Yue.

La vérité, cependant, est que l’interface Brain est conçue pour être indépendante du matériel, s’adaptant au facteur de forme sur lequel elle est exécutée. Bien entendu, cela ne veut pas dire que le matériel n’est pas important. Au cœur, le T-Mobile REVVL Plus, par exemple, est un téléphone économique, au prix d’environ 200 $. Ce n’est en aucun cas un produit phare, mais il vous en donne pour votre argent, y compris un processeur Snapdragon 625 et une double caméra arrière de 13 et 15 mégapixels, respectivement. Bien que 2 Go ne représentent pas beaucoup de RAM, Yue insiste sur le fait que le système d’exploitation de Brain.ai peut faire plus avec moins. De plus, encore une fois, nous ne savons pas quelles spécifications spécifiques l’appareil aura au lancement.

L’interface commence par un écran statique. À partir de là, vous interrogez les choses avec une invite vocale ou textuelle. Dans un exemple, Yue demande au système de « recommander un cadeau à ma grand-mère, qui ne peut pas sortir du lit ». À partir de là, Brain se met au travail pour extraire non pas la réponse à la requête, mais une interface qui lui est spécifique – dans ce cas, il s’agit des résultats agrégés du commerce électronique. La page résultante est simple du point de vue de la conception : texte noir sur fond blanc. Les phrases alternent avec des encadrés présentant les résultats (dans ce cas, des couvertures et des Kindle).

La requête se trouve en haut. Ceci, comme une grande partie de l’interface, est interactif. Dans ce cas, vous pouvez appuyer pour modifier la recherche. En appuyant sur une image, vous l’ajouterez au panier du site de commerce électronique tiers et vous pourrez effectuer la commande à partir de là. Je dois noter que tous les résultats de la démo ont été extraits directement d’Amazon. Yue indique que le système attirera quelque 7 000 sites de vente au détail au lancement et que vous pourrez hiérarchiser les résultats en fonction d’éléments tels que les détaillants et la taille de l’entreprise (si vous préférez soutenir les petites entreprises).

Crédits images : Brian Chauffage

Le shopping est le premier exemple que Yue me montre, et de nombreux principes fondamentaux s’appliquent à tous les niveaux. Il existe certainement une cohérence dans la conception entre les fonctionnalités. Cela est dû en grande partie au fait que l’appareil est dépourvu d’applications tierces. Cela représente un changement massif par rapport au paysage actuel des smartphones au cours des 15 dernières années.

« Du point de vue de la confidentialité et de la sécurité, nous voulons donner un nouveau niveau de contrôle que les gens n’ont pas actuellement », a déclaré Yue. « L’ordinateur vous comprend, il est désormais regroupé dans différentes applications. Ces modèles d’IA sont des boîtes noires – des machines de recommandation qui exploitent notre attention. Nous croyons en l’IA explicable. Nous vous expliquerons, à chaque étape, pourquoi nous faisons une recommandation. Il y a plus de personnes qui possèdent l’IA et non de grandes boîtes noires technologiques.

L’adaptabilité est un autre argument de vente important. Le modèle améliore les recommandations et devient plus personnalisé pour l’utilisateur à mesure que les requêtes sont exécutées et peaufinées. Bien entendu, les tiers ont été la principale raison pour laquelle les magasins d’applications ont révolutionné le secteur. Soudainement, vous êtes passé d’une seule entreprise créant toutes les expériences de votre téléphone à un système qui exploite l’intelligence et la créativité d’innombrables développeurs. L’expérience de Brain sera une combinaison de ce que son équipe de 100 personnes peut produire et de ce que le modèle d’IA peut imaginer. À mesure que le modèle s’améliore, ses fonctionnalités s’améliorent également. Brain.ai s’appuie sur son propre modèle pour l’interface principale, mais s’appuiera sur des tiers comme OpenAI et Google lorsqu’il déterminera qu’ils sont mieux équipés pour répondre à une requête spécifique.

Crédits images : Brian Chauffage

Il y a des limites à ce que l’on peut découvrir dans une démo comme celle-ci, donc, comme pour beaucoup d’autres éléments, je vais devoir attendre d’avoir un produit d’expédition en main pour vraiment évaluer l’expérience. Je suis particulièrement intéressé par la façon dont il gère certaines applications, comme l’imagerie. Il convient de noter que la gamme REVVL ne propose pas d’excellents appareils photo, donc à moins d’une mise à niveau importante, ce ne sera pas l’appareil pour ceux qui donnent la priorité aux photos/vidéos.

La caméra jouera également un rôle important dans la recherche. Un exemple dont nous avons discuté est de prendre une photo d’un menu dans un pays étranger. Non seulement il traduira (à la manière de Google Lens), mais il proposera également des recommandations alimentaires basées sur vos goûts. Yue a également brièvement démontré la génération d’images du système avec une demande simple adaptée à notre environnement : fabriquer des baskets magenta. Cela s’est fait rapidement, le seul véritable goulot d’étranglement étant la vitesse de connexion du centre de congrès (ironique, compte tenu des paramètres).

La connectivité est ici d’une importance vitale. Le traitement de l’IA est effectué hors appareil. J’ai discuté de la possibilité d’ajouter du traitement sur l’appareil, mais Yue n’a pas pu confirmer à quoi cela pourrait ressembler au lancement. Je n’ai pas non plus obtenu de réponse tout à fait claire concernant l’expérience hors ligne. Je soupçonne qu’une grande partie de la raison pour laquelle Deutsch Telekom s’intéresse autant à ce produit est qu’il ne pourrait pas exister de la même manière sans la 5G. Il rappelle le malheureux Firefox OS de Mozilla et les premiers jours de Chrome OS, ou tout autre exemple de produit qui perd des fonctionnalités importantes lorsqu’il est hors ligne.

Crédits images : Brian Chauffage

Yue a fondé Brain en 2015 et est resté son seul employé jusqu’à l’embauche d’un CTO l’année suivante (Yue reste l’unique fondateur). Né en Chine, il s’est d’abord connecté à la technologie grâce à son amour de la robotique et à sa participation au tournoi de football robotique RoboCup. À 18 ans, il fonde l’application sociale chinoise Friendoc. Deux ans plus tard, il a cofondé Benlai.com, qui est aujourd’hui l’une des plus grandes applications de livraison de nourriture du pays. Yue est depuis retourné dans la Bay Area pour diriger Brain.ai à plein temps. À ce jour, l’entreprise a levé 80 millions de dollars.

Après près d’une décennie, l’interface Brain est presque prête à être lancée – et elle arrive au moment idéal. L’air du temps est très axé sur la manière dont l’IA générative alimente l’expérience, depuis des appareils autonomes comme Rabbit et Humane Ai Pin jusqu’à des géants de la technologie comme Samsung proposant leurs propres « téléphones IA ».

En savoir plus sur le MWC 2024 sur TechCrunch

Source-146

- Advertisement -

Latest