Amazon Web Services (AWS) vient de lancer sa conférence re:Invent, basée à Las Vegas, dont la plupart impliquent la technologie la plus populaire de l’année, l’IA. Ces actualités, prises dans leur ensemble, nous donnent un aperçu des objectifs à long terme de l’entreprise en matière de plateformes d’intelligence artificielle.
Tout d’abord, AWS a dévoilé un outil destiné à la formation de modèles et à l’exécution de modèles formés. Trainium2, qui est évidemment destiné à la formation de modèles, a été conçu pour offrir des performances jusqu’à 4 fois supérieures et une efficacité énergétique 2 fois supérieure à celles de son prédécesseur. Amazon promet que ces puces permettront aux programmeurs de former des modèles rapidement et à moindre coût, grâce à une réduction de la consommation d’énergie. Anthropic a déjà annoncé son intention de construire des modèles utilisant les puces Trainium2.
Graviton4, en revanche, est plutôt destiné à un usage général. Ces processeurs sont basés sur l’architecture Arm, mais consomment moins d’énergie que les puces Intel ou AMD. Amazon promet une augmentation de 30 % des performances générales lors de l’utilisation d’un modèle d’IA entraîné intégré dans un processeur Graviton4. Cela devrait réduire les coûts de cloud computing pour les organisations qui utilisent régulièrement des modèles d’IA et offrir une légère augmentation de vitesse aux utilisateurs réguliers qui cherchent simplement à prendre de fausses photos d’Harry Potter lors d’une rave ou autre.
Au total, Graviton4 devrait permettre aux clients d’AWS de « traiter de plus grandes quantités de données, d’adapter leurs charges de travail, d’améliorer le délai d’obtention des résultats et de réduire leur coût total de possession ». Il est disponible aujourd’hui en avant-première et une version plus large est prévue dans les mois à venir.
En règle générale, lorsqu’une entreprise annonce de nouvelles puces internes, cela pose des problèmes aux fournisseurs tiers actuels comme NVIDIA. La société est un acteur majeur dans le domaine de l’IA d’entreprise, grâce aux entreprises qui utilisent ses GPU pour la formation et son CPU Grace pour centre de données basé sur Arm. Au lieu d’éviter le partenariat en faveur de puces propriétaires, Amazon renforce encore la relation en offrant aux entreprises clientes un accès cloud aux derniers GPU H200 AI de NVIDIA. Il exploitera également plus de 16 000 superpuces Nvidia GH200 Grace Hopper expressément pour l’équipe de recherche et développement de NVIDIA. Il s’agit d’une approche similaire à celle de son principal rival en matière d’IA, Microsoft, qui a également annoncé un partenariat renforcé avec NVIDIA en même temps qu’il
Amazon a également annoncé un nom probablement inspiré par le demi-dieu de Star Trek et non par le colporteur de conspirations adjacent à Trump. Il est décrit comme un « nouveau type d’assistant personnel génératif alimenté par l’IA » et est spécifiquement conçu pour aider à rationaliser les projets de travail et les tâches de service client. Il peut être adapté à n’importe quelle entreprise et offre des réponses pertinentes aux questions fréquemment posées. Amazon Q peut également générer lui-même du contenu et prendre des mesures en fonction des demandes des clients. Il personnalisera même les interactions en fonction du rôle d’un utilisateur au sein d’une entreprise.
Il existera sur les applications de communication comme Slack et dans les applications d’édition de texte couramment utilisées par les développeurs de logiciels. À cette fin, Q peut réellement modifier le code source et se connecter à plus de 40 systèmes d’entreprise, dont Microsoft 365, Dropbox, Salesforce et Zendesk, entre autres. Amazon Q est actuellement disponible en avant-première, et une version plus large sera bientôt disponible. Cela coûtera entre 20 $ et 30 $ par utilisateur et par mois, selon les fonctionnalités disponibles.
Alors qu’avons-nous appris ici ? Amazon mise gros sur l’IA, comme tout le monde. Plus précisément, elle se bat avec son ancien rival du cloud, Microsoft, pour devenir la société de référence en matière d’IA d’entreprise. Il utilise également l’IA pour maintenir sa domination dans le domaine du cloud computing, dans l’espoir de minimiser toute augmentation de part de marché pour Microsoft et d’autres acteurs comme Google et Alibaba.