La caméra de sécurité Genie S de Psync utilise GPT pour décrire ce qu’elle voit

Si vous demandez à Psync Labs, il vous dira que le problème avec les caméras de sécurité intelligentes est qu’elles ne savent pas ce qu’elles voient. Ces pings de mouvement que vous obtenez avec d’autres produits ? Défini par la façon dont la lumière se déplace devant son capteur, traitant une silhouette qui s’approche ou un oiseau volant à basse altitude avec la même alarme. Ainsi, l’objectif de Psync est d’améliorer la vision industrielle, mais également d’aller plus loin et d’associer cette vision à l’IA générative compatible GPT pour l’aider, ainsi que vous-même, à comprendre ce qu’elle peut voir. Son premier produit, le Genie S, est une caméra de sécurité qui vous enverra une description écrite de ce qui se passe (il pense).

Sur le papier, le Genie S possède des fonctionnalités similaires à celles de nombreuses autres unités de sécurité domestique abordables que je pourrais mentionner. Il y a une base panoramique-inclinable alimentée, un appareil photo de cinq mégapixels (produisant une vidéo 2K), quatre LED, un microphone et un haut-parleur. Mais il y a des différences, comme le fait qu’il ait la forme d’un cube qui, lorsqu’il n’est pas activé, pointe la lentille vers la base. Psync affirme qu’il s’agit de l’appareil photo le plus compact de sa catégorie, mais probablement pas avec une marge aussi importante que l’espère la société. L’installation est assez simple : posez-le sur une table ou utilisez le support à vis pour le placer dans un endroit plus ésotérique, branchez le câble USB-C de six pieds de long et vous êtes sur la bonne voie.

Psync affirme qu’une caméra plus intelligente sera mieux équipée pour capturer ce qui se passe à la maison, mais ce n’est pas son meilleur cas d’utilisation. Le vice-président du marketing, Echo Wong, affirme que le matériel est capable d’enregistrer ces « moments mémorables qui passent plus vite que nous ne pouvons sortir nos téléphones ». Mais je ne pense pas que vous voudriez l’acheter au cas où il capterait les premiers mots ou les premiers pas de Junior. L’argument de vente le plus prosaïque, celui qui ne fonctionnerait probablement pas aussi bien, est qu’il s’agit d’une caméra de sécurité avec la promesse supplémentaire de ne pas vous déranger avec des pings inutiles grâce à la promesse de l’intelligence artificielle.

Achetez-en un et vous aurez le choix entre une unité avec 32 Go de stockage intégré pour 35 $ ou 64 Go pour 40 $. Je le mentionne d’emblée parce que nous sommes tout à fait dans l’optique du « vous en avez pour votre argent » en termes de qualité d’image et de son. Il filme des vidéos 2K orientées verticalement, mais les clips sont assez flous, même si vous pouvez zoomer pour obtenir des détails à moitié utiles si nécessaire. Il n’aime pas trop de lumière, donc s’il est pointé vers une fenêtre (et/ou quelque chose de réfléchissant), des morceaux de l’image seront soufflés. De même, la qualité sonore est en quelque sorte un retour à une époque antérieure de flux croustillants et surcompressés. Vous obtiendrez un son tout aussi croustillant en utilisant la fonction de conversation, qui a des vibrations similaires de « talkie-walkie » que vous ne trouverez pas sur du matériel plus cher.

Laboratoires Psync

Bien sûr, personne n’est là pour ça, mais pour voir ce que cette nouvelle entreprise – dont on sait peu de choses – a concocté avec l’IA. ViewSay est l’outil de transcription de Psync qui utilise GPT, une forme d’IA générative, pour permettre à la caméra de décrire sous forme de texte ce qu’elle voit. ViewSay, qui coûte actuellement 99 cents par mois, promet d’identifier les objets, de trier les événements qui ont déclenché l’enregistrement dans une chronologie visuelle, de vous permettre de rechercher dans les clips contenant du texte et, bien sûr, les pings écrits susmentionnés. Payez vos frais, configurez cela, et votre téléphone fera un ping lorsqu’il détectera quelque chose d’intéressant et vous donnera la meilleure description de ce qui se passe qu’il peut gérer. Les utilisateurs peuvent également définir des catégories spécifiques, telles que « Personne », « Véhicule », « Animal de compagnie », et pourront éventuellement créer des alertes sur mesure, telles que « un chien saute sur le canapé ».

Oh, mais il y a un piège, car ces 99 cents par mois, assez raisonnables, ne sont qu’un essai d’une durée limitée, avant de passer à 7 $ par mois. Ce qui, nous pouvons tous en convenir, est plus qu’un peu trop élevé pour dépenser pour un produit comme celui-ci, surtout dans ce climat économique.

ViewSay est actuellement en version bêta, et bien que l’application qui vous incite à vous inscrire promette de nombreuses promesses, la société tient à maintenir de faibles attentes. Mon impression jusqu’à présent est que même si Psync a ici les bases d’une idée réalisable en théorie, l’essentiel de la pratique ne l’est pas. J’ai pointé la caméra vers un coin neutre de mon bureau et j’ai joué devant elle pour voir ce qu’elle ferait. Mon faux appel téléphonique, au cours duquel j’ai appris que ma femme (fictive) avait découvert le secret du mouvement perpétuel, est resté inaperçu et n’a pas été documenté. Eh bien, en quelque sorte – la caméra a envoyé une requête ping à mon téléphone pour dire : « Un homme est assis sur une chaise dans une pièce, regardant son reflet dans un miroir. »

En fait, je suis injuste, puisque le système peut également faire des estimations assez précises à d’autres moments. Par exemple, alors que j’installais le matériel tard dans la soirée, l’application m’a dit « un homme est assis par terre, tenant un téléphone portable à la main ». Quelques jours plus tard, j’ai placé la caméra face à mon téléviseur et à Echo Show avant de me retourner pour utiliser mon ordinateur portable, qui n’était vraiment visible que dans le reflet sur l’écran du téléviseur. Peu de temps après, l’application a envoyé une requête ping pour indiquer qu’elle pouvait voir un message « Un homme est assis devant un ordinateur portable, regardant l’écran et l’utilisant éventuellement à des fins de travail ou de divertissement ». Il s’agissait soit d’une supposition extrêmement chanceuse, soit d’un faux positif, soit d’un signe de la précision de cette information à l’avenir.

Image du Psync Genie S dans sa position fermée.

Photo de Daniel Cooper/Engadget.

Lorsqu’il détecte quelque chose qui se passe de cette manière, le système enregistre un clip de 12 secondes sur son stockage local. Ces clips sont conservés pendant au moins 14 jours et lorsque vous les avez visionnés dans l’application, vous pouvez également les enregistrer sur votre téléphone. Je comprends que vous pourrez également prendre des clips plus longs lorsqu’un mouvement est détecté, mais cette fonctionnalité ne semble pas encore disponible. Vous pourrez également partager un flux en direct de votre caméra, à l’aide de WebRTC, avec jusqu’à quatre spectateurs, via un navigateur, pendant 30 minutes maximum à la fois. Vous vous demandez peut-être dans quelle mesure tout cela est sécurisé et ce qui arrive exactement à vos données. Psync m’a dit que son modèle d’IA est basé sur une instance AWS et que les images sont protégées à l’aide d’un cryptage AES 256 bits. Les images enregistrées seront stockées localement sur l’appareil, mais l’image initiale de la vidéo est envoyée vers le cloud pour une analyse plus approfondie.

En tant que sceptique en matière d’IA et personne qui n’est pas ravi de câbler chaque coin de ma maison avec une caméra, je suis par défaut hostile au plan de Psync ici. Mais je peux au moins voir où Psync cherche à ajouter de la valeur à la proposition de caméra de sécurité standard. Si vous êtes en déplacement et que vous recevez un ping indiquant qu’il y a une personne dans votre salon, alors qu’il ne devrait pas y en avoir, alors c’est très utile. Surtout si vous pouvez simplement vous connecter au flux en direct et voir par vous-même ce qui se passe et si vous devez faire quelque chose. Même si l’histoire macro est effrayante, je peux comprendre la logique que quelqu’un appliquerait pour en acheter un ou deux.

Mais cela vaut également la peine de dire que ce que je viens de décrire n’est pas encore ce que Psync vend, mais seulement ce vers quoi il fait signe. Le système nécessitera davantage de formation et beaucoup plus de données provenant d’une base d’utilisateurs plus large, jusqu’à ce qu’il puisse commencer à vous proposer des descriptions plus concrètes. Maintenant, je suis sûr que dans un an ou deux, ce sera le cas, mais d’ici là, vous adhérez essentiellement à un écosystème où vous payez pour le privilège d’être un bêta-testeur. Et ces frais d’abonnement mensuels de 7 $ ? Aie.

Source-145