Pendant longtemps, les bases de données vectorielles étaient un produit de niche, mais comme elles sont particulièrement adaptées pour fournir du contexte et de la mémoire à long terme à de grands modèles de langage, tout le monde dans l’espace des bases de données semble maintenant essayer d’intégrer la recherche vectorielle sur leurs bases de données existantes. produits le plus rapidement possible. Pendant ce temps, des services dédiés comme Pinecone, qui a été fondé par l’équipe derrière Amazon SageMaker, mènent la charge, Pinecone ayant levé un total de 138 millions de dollars depuis sa création en 2019. Aujourd’hui, Pinecone lance Pinecone Serverless, un nouveau – et de manière significative architecture sans serveur améliorée pour alimenter son service.
Pinecone Serverless sépare désormais les lectures, les écritures et le stockage, ce qui devrait réduire les coûts pour les utilisateurs. En effet, Pinecone affirme que sa nouvelle architecture peut offrir une réduction des coûts de 10 à 100 fois. La nouvelle architecture prend désormais en charge le clustering vectoriel au-dessus du stockage blob. Cela se traduit par des latences plus faibles et par la capacité de Pinecone Serverless à prendre en charge des volumes de données massifs. De même, Pinecone Serverless introduit de nouveaux algorithmes d’indexation et de récupération pour permettre une recherche vectorielle rapide dans ce stockage blob. Le service propose désormais également une couche de calcul multi-tenant.
« Comme il est véritablement sans serveur, il élimine complètement le besoin pour les développeurs de provisionner ou de gérer l’infrastructure et leur permet de créer des applications GenAI plus facilement et de les commercialiser beaucoup plus rapidement », explique la société dans son annonce. « En conséquence, les développeurs ayant des cas d’utilisation de toute taille peuvent créer des applications GenAI plus fiables, efficaces et plus percutantes avec n’importe quel LLM de leur choix, conduisant à une vague imminente d’incroyables applications GenAI arrivant sur le marché. »
Dès le départ, Pinecone Serverless proposera des intégrations avec plusieurs autres services d’IA et backend, notamment Anthropic, Anyscale, Cohere, Confluent, Langchain, Pulumi et Vercel. « La mission de Vercel est d’aider le monde à commercialiser les meilleurs produits, et à l’ère de GenAI qui nécessite Pinecone comme composant de base de données vectorielles », a déclaré Guillermo Rauch, PDG et fondateur de Vercel. « C’est pourquoi nous annonçons que tous les utilisateurs de Vercel peuvent désormais ajouter Pinecone Serverless à leurs applications en quelques clics seulement, avec des fonctionnalités encore plus intéressantes à venir.