Deep Render pense que l’IA détient la clé d’une compression vidéo plus efficace

Chri Besenbruch, PDG de Deep Render, voit de nombreux problèmes dans la façon dont les normes de compression vidéo sont développées aujourd’hui. Il pense qu’ils n’avancent pas assez vite, déplore le fait qu’ils soient en proie à l’incertitude juridique et dénonce leur dépendance à l’égard du matériel spécialisé pour l’accélération.

« Le processus de développement du codec est cassé », a déclaré Besenbruch dans une interview avec TechCrunch avant Disrupt, où Deep Render participe au Disrupt Battlefield 200. « Dans l’industrie de la compression, il y a un défi important à trouver une nouvelle voie à suivre et à chercher pour de nouvelles innovations.

Cherchant une meilleure voie, Besenbruch a cofondé Deep Render avec Arsalan Zafar, qu’il a rencontré à l’Imperial College de Londres. À l’époque, Besenbruch étudiait l’informatique et l’apprentissage automatique. Lui et Zafar ont collaboré à un projet de recherche impliquant la distribution de téraoctets de vidéo sur un réseau, au cours duquel ils disent avoir fait l’expérience directe des lacunes de la technologie de compression.

La dernière fois que TechCrunch a couvert Deep Render, la startup venait de clôturer un tour de table de 1,6 million de livres sterling (1,81 million de dollars) dirigé par Pentech Ventures avec la participation de Speedinvest. Au cours des deux années qui ont suivi, Deep Render a levé plusieurs millions de dollars supplémentaires auprès d’investisseurs existants, portant son total levé à 5,7 millions de dollars.

« Nous nous sommes dit que si les tuyaux Internet sont difficiles à étendre, la seule chose que nous pouvons faire est de réduire la taille des données qui transitent par les tuyaux », a déclaré Besenbruch. « Par conséquent, nous avons décidé de fusionner l’apprentissage automatique et l’IA et la technologie de compression pour développer une méthode fondamentalement nouvelle de compression des données en obtenant des taux de compression d’image et de vidéo nettement meilleurs. »

Deep Render n’est pas le premier à appliquer l’IA à la compression vidéo. DeepMind d’Alphabet a adapté un algorithme d’apprentissage automatique développé à l’origine pour jouer à des jeux de société au problème de la compression des vidéos YouTube, ce qui a entraîné une réduction de 4 % de la quantité de données que le service de partage de vidéos doit diffuser aux utilisateurs. Ailleurs, il y a la startup WaveOne, qui affirme que son codec vidéo basé sur l’apprentissage automatique surpasse toutes les normes existantes sur les mesures de qualité populaires.

Mais la solution de Deep Render est indépendante de la plate-forme. Pour le créer, Besenbruch dit que la société a compilé un ensemble de données de plus de 10 millions de séquences vidéo sur lesquelles ils ont formé des algorithmes pour apprendre à compresser efficacement les données vidéo. Deep Render a utilisé une combinaison de matériel sur site et cloud pour la formation, le premier comprenant plus d’une centaine de GPU.

Deep Render affirme que la norme de compression résultante est 5 fois meilleure que HEVC, un codec largement utilisé et peut fonctionner en temps réel sur des appareils mobiles avec une puce d’accélération AI dédiée (par exemple, le Apple Neural Engine dans les iPhones modernes). Besenbruch dit que la société est en pourparlers avec trois grandes entreprises technologiques – toutes avec des capitalisations boursières supérieures à 300 milliards de dollars – au sujet de pilotes rémunérés, bien qu’il ait refusé de partager les noms.

Eddie Anderson, associé fondateur de Pentech et membre du conseil d’administration de Deep Render, a partagé par e-mail : « L’approche d’apprentissage automatique des codecs de Deep Render perturbe complètement un marché établi. Non seulement c’est une voie logicielle vers le marché, mais leur [compression] les performances sont nettement meilleures que l’état actuel de la technique. Alors que les demandes de bande passante continuent d’augmenter, leur solution a le potentiel d’améliorer considérablement les performances commerciales des propriétaires et distributeurs de médias actuels.

Deep Render emploie actuellement 20 personnes. D’ici la fin de 2023, Besenbruch s’attend à ce que ce nombre fasse plus que tripler pour atteindre 62.

Source-146