L’IA doit normalement être entraînée sur du matériel existant pour détecter des objets, mais Meta permet à la technologie de repérer des objets sans aide. Le géant des médias sociaux a publié un modèle d’IA « Segment Anything » qui peut détecter des objets dans des images et des vidéos même s’ils ne faisaient pas partie de l’ensemble de formation. Vous pouvez sélectionner des éléments en cliquant dessus ou en utilisant des invites de texte au format libre. Comme Reuter explique, vous pouvez taper le mot « chat » et regarder l’IA mettre en évidence tous les félins sur une photo donnée.
Le modèle peut également fonctionner en tandem avec d’autres modèles. Il peut aider à reconstruire un objet en 3D à l’aide d’une seule image ou à partir de vues d’un casque de réalité mixte. En effet, Segment Anything peut limiter le besoin de formation supplémentaire en IA.
Le modèle d’IA et un ensemble de données seront téléchargeables avec une licence non commerciale. Autrement dit, les créateurs ne peuvent pas l’utiliser pour les produits. Il s’agit principalement de la recherche et de l’élargissement de l’accès à la technologie. À l’heure actuelle, Meta utilise une technologie quelque peu similaire pour modérer le contenu interdit, recommander des publications et taguer des photos.
Les développeurs reconnaissent que le modèle existant est défectueux. Il peut manquer des détails plus fins et n’est pas aussi précis pour détecter les limites que certains modèles. Et bien que Segment Anything puisse gérer les invites en temps réel, il s’enlise lorsqu’un traitement d’image exigeant est impliqué. Certains outils d’IA plus spécialisés sont susceptibles de surpasser ce modèle dans leurs domaines respectifs, déclare Meta.
Vous n’êtes pas sur le point de voir cette IA dans des robots ou d’autres appareils où une détection d’objet rapide et précise est (généralement) vitale. Cependant, des modèles comme celui-ci peuvent toujours être utiles dans des situations où il n’est pas pratique de s’appuyer exclusivement sur des données de formation. Un réseau social pourrait utiliser la technologie pour suivre un volume de contenu en croissance rapide. Au moins, cela montre que Meta veut généraliser la vision par ordinateur.
Meta n’est pas étranger au partage des percées de l’IA, tel un traducteur pour les langues non écrites. Cela dit, il y a une pression sur l’entreprise pour montrer qu’elle est autant une puissance dans la catégorie que des poids lourds de la technologie comme Google et Microsoft. Il prévoit déjà des « personnages » d’IA générative pour ses applications sociales, et des inventions comme Segment Anything montrent qu’il a quelques avantages qui lui sont propres.