Le co-fondateur et PDG de Rabbit, Jesse Lyu, n’a pas peur de la mort… du moins de la mort de l’entreprise. Il a déclaré à TechCrunch que l’entreprise est une startup dont la fortune peut être influencée par les caprices de rivaux multimilliardaires – mais ce n’est pas une raison pour abandonner et rentrer chez soi.
Apparaissant sur scène à StrictlyVC LA, Lyu a expliqué son approche plutôt philosophique de la menace que Google, Microsoft ou Apple vienne les écraser. (Les citations ont été légèrement modifiées pour plus de clarté.)
Le r1 de Rabbit, l’assistant IA de poche qui a suscité un battage médiatique considérable après ses débuts au CES, est certainement une proposition originale. De la moitié de la taille d’un téléphone, l’appareil agit strictement comme un assistant vocal, mais est capable de faire fonctionner vos applications à distance et d’effectuer des actions complexes, ainsi que de répondre à des questions et de poursuivre une conversation comme ChatGPT. Il a décrit les deux parties comme « l’intention » et « l’action ».
« J’ai eu cette vision il y a de nombreuses années, en fait il y a 10 ans, mais la technologie n’était pas prête. C’est la première fois dans l’histoire qu’un dispositif comme celui-ci est réellement possible », a déclaré Lyu.
Il a expliqué qu’il avait été intrigué par la capacité des LLM à comprendre le langage et les intentions et qu’avec l’apparente polyvalence des systèmes basés sur des transformateurs, il était naturel d’essayer de les amener à effectuer également des actions.
« Nous avons immédiatement essayé d’utiliser des super-invites pour faire fonctionner ce modèle de langage, et le résultat a été très misérable », se souvient-il. « Il existe une démo d’une autre entreprise qui utilise un LLM pour accéder à la dernière vidéo YouTube de MrBeast et laisser un commentaire. Oui, en théorie, les modèles linguistiques peuvent le faire. Mais cela vous obligerait littéralement à regarder votre écran faire cela étape par étape. Et il faut environ deux à trois minutes pour terminer une tâche comme celle-là. Nous ne pensons tout simplement pas que cela puisse se transformer en une bonne expérience pour l’utilisateur final.
Leur solution est le « modèle d’action à grande échelle », qui est formé sur des heures et des heures d’utilisateurs réels interagissant avec des applications populaires : « Spotify, Uber, Expedia, DoorDash, etc. Nous avons les 800 applications les plus fréquentes. Ensuite, nous mettons en place ce réseau symbolique neuronal et demandons à cette IA, que nous appelons désormais grand modèle d’action, d’examiner ces clips, mais image par image. L’idée est que symboliquement, l’IA sera finalement suffisamment intelligente pour extraire tous les boutons, tous les éléments, et nous pourrons alors construire une logique pour automatiser.
La partie linguistique est toujours exécutée sur des services LLM tiers comme Perplexity, qui semble tenter de capitaliser sur le succès de Rabbit, en offrant un an de service gratuit en plus de tout ce que propose la r1. J’ai suggéré que les coûts de l’API et d’autres considérations pourraient représenter un danger pour la solvabilité de la startup.
« Tout d’abord, nous ne perdons pas d’argent en vendant la r1, ce qui est une réussite très, très, très importante, en particulier pour les nouvelles startups de génération 1. Nous n’allons pas faire faillite en vendant plus d’unités. Je donne tout le mérite à mon équipe matérielle composée de gars formidables pour être capable de négocier les pièces et la nomenclature. [bill of material] les coûts », a-t-il déclaré. « Nous sommes vraiment proches des 100 000 commandes. Deux jours avant le keynote II annoncé à mon équipe, ce serait vraiment bien si nous pouvions vendre 500 unités dès le premier jour. Mais nous en avons vendu 18 000. »
Quant à l’abonnement, Lyu ne considère tout simplement pas que cela fonctionne, surtout quand la thèse de l’appareil est simple et bon marché. Bien qu’il ait mentionné que les utilisateurs pourront plus tard former et vendre leurs propres modèles spécifiques à l’application, Rabbit en prendrait une part, mais il a averti qu’il s’agissait d’un plan à long terme sans encore de détails.
Enfin, confronté au fait que les entreprises les plus grandes et les plus riches du monde dépensent des milliards pour progresser dans l’IA, Lyu a fourni une perspective presque zen sur la perspective d’être écrasées sous la botte de Google, Microsoft ou Apple (dont le PDG Tim Cook vient de dire qu’il « innovera » en matière d’IA cette année).
« Je ne me fais pas d’illusions en pensant que nous ne sommes pas une startup. Nous sommes une startup », a-t-il déclaré. « Je veux dire, la première leçon que j’ai apprise de Y Combinator il y a deux ans est que 99 % des startups vont mourir. Si votre mentalité en tant qu’entrepreneur est : « Oh, j’ai une idée géniale, et je peux garantir que cela fonctionnera, peu importe ce que toutes ces grandes entreprises technologiques essaient… » Je veux dire, vous êtes délirant. Cela n’existe pas. La réalité est qu’une startup est un jeu de survie, et vous feriez mieux de passer votre temps à vous concentrer sur vos propres affaires.
« Ils vont faire ce qu’ils vont faire, et je vais faire ce que je vais faire, n’est-ce pas ? Il doit y avoir des fondateurs, quand ils ont appris qu’Apple faisait Apple Cars, ils ont arrêté, n’est-ce pas ? Ils viennent d’annuler. Maintenant quoi? Je pense que c’est bien d’avoir ce niveau de concurrence qui ne fera que nous aider à croître plus vite, ou à mourir plus vite, ce qui est la nature des startups. C’est soit ou… je ne sais pas encore. Mais je fais de mon mieux – comme je l’ai dit, c’est un jeu de survie.
Vous pouvez regarder le panel complet ci-dessous.