dimanche, décembre 22, 2024

Betaworks parie sur les agents IA dans la dernière cohorte « Camp »

Betaworks adopte la tendance de l’IA non pas avec un énième LLM, mais plutôt avec un ensemble de modèles de type agent automatisant des tâches quotidiennes qui ne sont pourtant pas si simples à définir. Le dernier incubateur « Camp » de l’investisseur a formé et financé neuf startups d’agents d’IA qui, espèrent-ils, assumeront les tâches les plus fastidieuses d’aujourd’hui.

Les cas d’utilisation de bon nombre de ces entreprises semblent prometteurs, mais l’IA a tendance à avoir du mal à tenir ses promesses. Feriez-vous confiance à une toute nouvelle IA pour trier vos e-mails à votre place ? Qu’en est-il de l’extraction et de la structuration des informations d’une page Web ? Est-ce que quelqu’un s’opposera à ce que l’IA organise des réunions partout où cela fonctionne ?

Il existe un élément de confiance qui n’a pas encore été établi avec ces services, ce qui se produit avec la plupart des technologies qui changent notre façon d’agir. Demander des directions à MapQuest semblait étrange jusqu’à ce que ce ne soit pas le cas – et maintenant la navigation GPS est un outil quotidien. Mais les agents IA en sont-ils à ce stade ? Le PDG et fondateur de Betaworks, John Borthwick, le pense. (Divulgation : Jordan Crook, ancien rédacteur en chef de TechCrunch et animateur de Disrupt, a quitté TC pour travailler dans l’entreprise.)

« Vous abordez quelque chose auquel nous avons passé beaucoup de temps à réfléchir », a-t-il déclaré à TechCrunch. « Alors que l’IA agentique en est à ses balbutiements – et qu’il existe des problèmes liés aux taux de réussite des agents, etc. – nous constatons d’énormes progrès même depuis le début du camp. »

Même si la technologie continuera de s’améliorer, Borthwick a expliqué que certains clients sont prêts à l’adopter dans son état actuel.

« Historiquement, nous avons vu des clients faire un acte de foi, même pour des tâches à enjeux plus élevés, si un produit était « assez bon ». Le projet Bill.com d’origine, bien qu’il ait fait des choses intéressantes avec l’OCR et le scraping d’e-mails, n’a pas toujours réussi, et les utilisateurs lui ont toujours fait confiance pour des transactions valant des milliers de dollars, car cela rendait une tâche terrible moins terrible. Et au fil du temps, grâce à une conception d’interface hautement communicative, les boucles de commentaires de ces clients ont créé un produit encore meilleur et plus fiable », a-t-il déclaré.

« Pour l’instant, la plupart des premiers utilisateurs des produits de Camp sont des développeurs, des fondateurs et des premiers utilisateurs de la technologie, et ce groupe a toujours été prêt à tester patiemment et à fournir des commentaires sur ces produits, qui finiront par devenir grand public. »

Betaworks Camp est un accélérateur de trois mois au cours duquel des entreprises sélectionnées dans le thème choisi reçoivent une aide pratique sur leur produit, leur stratégie et leurs connexions avant d’être chassées avec un chèque de 500 000 $ – gracieuseté de Betaworks lui-même, Mozilla Ventures, Differential Ventures et Tige de l’IA. Mais pas avant que les startups ne se pavanent lors de la journée de démonstration, le 7 mai.

Nous avons cependant jeté un coup d’œil à la programmation au préalable. Voici les trois qui m’ont le plus marqué.

Twin automatise les tâches à l’aide d’un « modèle d’action » comme celui dont nous entendons parler Rabbit depuis quelques mois maintenant (mais qui n’a pas encore été livré). En entraînant un modèle sur de nombreuses données représentant des interfaces logicielles, il peut (selon ces entreprises) apprendre à effectuer des tâches courantes, des tâches plus complexes qu’une API ne peut gérer, mais pas au point de ne pas pouvoir les déléguer à un « stagiaire intelligent. » En fait, nous les avons rédigés en janvier.

Crédits images : Double

Ainsi, au lieu de demander à un ingénieur back-end de créer un script personnalisé pour effectuer une certaine tâche, vous pouvez le démontrer ou le décrire dans un langage ordinaire. Des trucs comme « mettez tous les curriculum vitae que nous avons reçus aujourd’hui dans un dossier dans Dropbox et renommez-les d’après le candidat, puis envoyez-moi le lien de partage dans Slack. » Et une fois que vous avez peaufiné ce flux de travail (« Oups, cette fois, ajoutez la date de candidature aux noms de fichiers »), cela peut simplement être la nouvelle façon dont ce processus fonctionne. L’objectif de l’entreprise est d’automatiser les 20 % de tâches qui occupent 80 % de notre temps. La vraie question est probablement de savoir si elle peut le faire à un prix abordable. (Twin a refusé de préciser la nature de son modèle et de son processus de formation.)

Skej vise à améliorer le processus parfois pénible consistant à trouver un moment de réunion qui convienne à deux (ou trois, ou quatre…) personnes. Il vous suffit de mettre le bot en copie dans un e-mail ou un fil de discussion Slack et le processus de rapprochement de la disponibilité et des préférences de chacun démarrera. S’il a accès aux horaires, il les vérifiera ; si quelqu’un dit qu’il préférerait l’après-midi si c’est le jeudi, ça marche ; vous pouvez dire que certaines personnes ont la priorité ; et ainsi de suite. Quiconque travaille avec un assistant de direction qualifié sait qu’il est irremplaçable, mais il y a de fortes chances que tous les EA préfèrent consacrer moins de temps à des tâches qui ne sont qu’un tas de « Et ça ? Non? Que dis-tu de ça? »

Crédits images : Skej

En tant que misanthrope, je n’ai pas ce problème de planification, mais j’apprécie que d’autres l’aient, et je préférerais également une solution de type « réglez-le et oubliez-le » où ils acceptent simplement les résultats. Et cela est tout à fait à la portée des agents d’IA d’aujourd’hui, qui seraient principalement chargés de comprendre le langage naturel plutôt que les formulaires.

Jsonify est une évolution des scrapers de sites Web qui peuvent extraire des données de contextes relativement non structurés. Cela se fait depuis des lustres, mais le moteur qui extrait les informations n’a jamais été aussi intelligent. S’il s’agit d’un document volumineux et plat, ils fonctionnent bien. S’il se trouve dans des onglets sur site ou dans une liste visuelle mal codée destinée aux humains, ils peuvent échouer. Jsonify utilise la compréhension améliorée des modèles d’IA visuels actuels pour mieux analyser et trier les données qui peuvent être inaccessibles aux simples robots d’exploration.

Crédits images : Jsonifier

Vous pouvez donc effectuer une recherche d’options Airbnb dans une zone donnée, puis demander à Jsonify de les déposer toutes dans une liste structurée avec des colonnes pour le prix, la distance de l’aéroport, la note, les frais cachés, etc. Vous pouvez ensuite faire la même chose sur Vacasa et extrayez les mêmes données – peut-être pour les mêmes endroits (je l’ai fait et j’ai économisé environ 150 $ l’autre jour, mais j’aurais aimé pouvoir automatiser le processus). Ou, vous savez, faire des trucs professionnels.

Mais l’imprécision inhérente aux LLM n’en fait-elle pas un outil discutable pour ce travail ? « Nous avons réussi à construire un système de garde-fou et de contrôle croisé assez robuste », a déclaré le fondateur Paul Hunkin. « Nous utilisons quelques modèles différents au moment de l’exécution pour comprendre la page, qui fournissent une certaine validation – et les LLM que nous utilisons sont adaptés à notre cas d’utilisation, ils sont donc généralement assez fiables même sans la couche de garde-corps. En règle générale, nous constatons une précision d’extraction de plus de 95 %, selon le cas d’utilisation. »

Je pourrais voir n’importe lequel d’entre eux être utile dans probablement n’importe quelle entreprise de pointe. Les autres membres de la cohorte sont un peu plus techniques ou situationnels – voici les six autres :

  • Resolved AI – automatisation agentique des flux de travail cloud. Cela semble utile jusqu’à ce que des intégrations sur mesure le rattrapent.
  • Floode – un gestionnaire de boîte de réception IA qui lit votre courrier électronique et trouve les éléments importants tout en préparant les réponses et les actions appropriées.
  • IA extensible – votre IA est-elle en régression ? Demandez à votre médecin si Extensible est la bonne infrastructure de test et de journalisation pour votre déploiement.
  • Adversaire – un personnage virtuel destiné aux enfants avec lequel ils peuvent avoir de nombreuses interactions et jouer. Cela ressemble à un champ de mines d’un point de vue éthique et légal, mais quelqu’un doit le traverser.
  • Recherche en haute dimension – le jeu infra. Un cadre pour les agents d’IA basés sur le Web avec un modèle de paiement à l’utilisation. Ainsi, si les expériences de votre entreprise échouent, vous ne devez que quelques dollars.
  • Mbodi – IA générative pour la robotique, un domaine où les données de formation sont relativement rares. Je pensais que c’était un mot africain, mais c’est juste « incarner ».

Il ne fait aucun doute que les agents d’IA joueront un certain rôle dans les flux de travail logiciels de plus en plus automatisés dans un avenir proche, mais la nature et l’étendue de ce rôle ne sont pas encore écrites. De toute évidence, Betaworks vise à mettre le pied dans la porte plus tôt, même si certains produits ne sont pas encore tout à fait prêts pour leurs débuts sur le marché de masse.

Vous pourrez voir les entreprises présenter leurs produits agents le 7 mai.

Correction : cette histoire a été mise à jour pour indiquer que le fondateur de Jsonify est Paul Hunkin, et non Ananth Manivannan.

Source-146

- Advertisement -

Latest