Amazon annonce un aperçu des nouvelles instances Inf2 conçues pour les modèles plus grands

À mesure que les entreprises construisent des modèles d’apprentissage automatique plus complexes, le coût de la formation et de l’exécution de ces modèles devient un véritable problème. AWS a créé une série d’instances personnalisées pour aider à réduire les coûts et a présenté aujourd’hui un aperçu d’une toute nouvelle instance Inf2 pour EC2 conçue pour traiter plus efficacement les données de charges de travail plus importantes.

Le PDG d’AWS, Adam Selipsky, en a fait l’annonce aujourd’hui à AWS re:Invent à Las Vegas.

Comme Selipsky l’a dit au public d’AWS re:Invent, « Inf1 est idéal pour les modèles de complexité petite à moyenne, mais pour les modèles plus grands, les clients se sont souvent appuyés sur des instances plus puissantes car ils n’ont pas réellement la configuration optimale des ressources pour leur inférence. charges de travail.

Ils l’ont fait parce que jusqu’à présent, il n’y avait tout simplement pas d’autre solution disponible pour aider à réduire le coût et la complexité du traitement de ces charges de travail plus importantes.

« Vous souhaitez choisir la solution la mieux adaptée à vos besoins spécifiques, c’est pourquoi je suis ravi d’annoncer aujourd’hui un aperçu de l’instance Inf2 alimentée par notre nouvelle puce inferentia2 », a-t-il déclaré.

Pour les personnes qui ont besoin de cette puissance supplémentaire, Inf2 la fournit. « Les clients peuvent déployer un modèle de 175 milliards de paramètres pour l’inférence sur un seul instrument avec un débit quatre fois plus élevé et 1/10 de la latence des instances Inf1 », a-t-il déclaré.

Les nouvelles instances sont disponibles en avant-première à partir d’aujourd’hui.

En savoir plus sur AWS re:Invent 2022 sur TechCrunch

Source-146