Les voitures autonomes sont mises au régime des données

Une voiture autonome de Google.

Pour les développeurs de voitures autonomes, comme de nombreux utilisateurs d’iPhone et de Google Photos, le coût croissant du stockage de fichiers sur le cloud est devenu un casse-tête lancinant.

Dès le début, les entreprises de robocar ont poursuivi une approche de force brute pour maximiser les kilomètres et les données. « Nous pourrions prendre toutes les données que les voitures ont vues au fil du temps, les centaines de milliers de piétons, de cyclistes et de véhicules, [and] en tirer un modèle de la façon dont nous nous attendons à ce qu’ils se déplacent », a déclaré Chris Urmson, l’un des premiers dirigeants du projet de conduite autonome de Google, lors d’une conférence TED en 2015.

Urmson a parlé à une époque où les prototypes de véhicules autonomes étaient relativement peu nombreux et où la poignée d’entreprises qui les testaient pouvait se permettre de conserver presque tous les points de données qu’ils récupéraient sur la route. Mais près d’une décennie plus tard, le projet de Google et bien d’autres sont tombés loin derrière leurs propres prédictions de la chronologie du succès. Des flottes croissantes, des capteurs plus sophistiqués et des budgets plus serrés obligent les entreprises travaillant sur les services de robotaxi et de robofreight à être plus pointilleuses sur ce qui reste sur leurs serveurs.

La nouvelle retenue est un signe de maturité pour une industrie qui a commencé à déplacer des personnes et des marchandises sans chauffeur dans quelques villes lorsque le temps est clément et que les rues sont relativement dégagées, mais qui n’a pas encore généré de bénéfices. Déterminer quelles données conserver et lesquelles supprimer pourrait être la clé pour étendre le service à davantage d’emplacements alors que les entreprises forment leur technologie sur les nuances de nouveaux domaines.

« Avoir des tonnes et des tonnes de données en plus est précieux dans une certaine mesure », déclare Andrew Chatham, qui supervise l’infrastructure informatique de la technologie sans conducteur de Google, Waymo. « Mais à un moment donné, avoir des données plus intéressantes est important. » Des rivaux tels qu’Aurora, Cruise, Motional et TuSimple surveillent également de plus près leurs magasins de données.

La tendance pourrait se propager à un moment où les projets sans conducteur sont confrontés à des pressions pour contrôler les dépenses après des années de pertes. Des entreprises allant de General Motors, qui possède le service de robotaxi Cruise, à Alphabet, propriétaire de Waymo, sont au milieu de vastes réductions de coûts cette année, y compris des licenciements massifs, alors que les ventes dans les activités principales ralentissent en raison d’une économie chancelante. Pendant ce temps, les financements bon marché et faciles se tarissent pour les startups de véhicules autonomes.

Naturellement, toutes les dépenses sont sous contrôle. Amazon Web Services facture environ 2 cents par gigaoctet par mois pour son populaire service de stockage en nuage S3, un prix qui s’additionne rapidement sur les projets gourmands en données et double dans certains cas en tenant compte des coûts de bande passante pour transférer des données. Intel estimait en 2016 que chaque véhicule autonome générerait 4 000 gigaoctets de données par jour, un volume qui coûterait environ 350 000 dollars à stocker pendant un an aux prix actuels d’Amazon.

La collecte de données peut sembler perverse pour l’industrie technologique. Des entreprises comme Google et Meta ont longtemps été ridiculisées et même pénalisées pour avoir collecté tout ce qu’elles pouvaient, y compris les emplacements, les clics et les recherches des utilisateurs, avec l’idée qu’une meilleure compréhension du comportement conduit à des services mieux conçus. Le mantra a créé une culture de collecte de données malgré toute application claire. Par exemple, le PDG de Google, Sundar Pichai, a reconnu en 2019 que seul « un petit sous-ensemble de données permet de diffuser des annonces ».

Les développeurs de voitures autonomes avaient initialement une philosophie similaire de maximisation des données. Ils génèrent des vidéos à partir de réseaux de caméras à l’intérieur et à l’extérieur des véhicules, des enregistrements audio à partir de microphones, des nuages ​​de points cartographiant des objets dans l’espace à partir de lidar et de radar, des lectures de diagnostic à partir de pièces de véhicule, des lectures GPS, et bien plus encore.

Certains ont supposé que plus il y avait de données collectées, plus le système de conduite autonome pouvait devenir intelligent, explique Brady Wang, qui étudie les technologies automobiles chez Counterpoint. Mais l’approche n’a pas toujours fonctionné car le volume et la complexité des données les rendaient difficiles à organiser et à comprendre, explique Wang.

Source-147