Mozilla a ajouté un outil de traduction officiel à Firefox qui ne s’appuie pas sur le traitement en nuage pour faire son travail, mais exécute le processus basé sur l’apprentissage automatique directement sur votre propre ordinateur. C’est un énorme pas en avant pour un service populaire fortement lié à des géants comme Google et Microsoft.
L’outil de traduction, appelé Firefox Translations, peut être ajouté à votre navigateur ici. Il devra télécharger certaines ressources la première fois qu’il traduit une langue, et il est probable qu’il puisse télécharger des modèles améliorés si nécessaire, mais le travail de traduction proprement dit est effectué par votre ordinateur, et non dans un centre de données à quelques centaines de kilomètres.
Ceci est important non pas parce que de nombreuses personnes ont besoin de traduire dans leurs navigateurs hors ligne – comme une porte moustiquaire pour un sous-marin, ce n’est pas vraiment un cas d’utilisation qui a du sens – mais parce que l’objectif est de réduire la dépendance finale aux fournisseurs de cloud avec des arrière-pensées pour une tâche qui ne requiert plus leurs ressources.
C’est le résultat du projet Bergamot financé par l’UE, qui a vu Mozilla collaborer avec plusieurs universités sur un ensemble d’outils d’apprentissage automatique qui rendraient possible la traduction hors ligne. Normalement, ce type de travail est effectué par des clusters GPU dans des centres de données, où de grands modèles de langage (taille de gigaoctets et avec des milliards de paramètres) seraient déployés pour traduire la requête d’un utilisateur.
Mais alors que les outils basés sur le cloud de Google et Microsoft (sans parler de DeepL et d’autres concurrents parvenus) sont précis et rapides (en raison de leur puissance de calcul quasi illimitée), il existe un risque fondamental pour la confidentialité et la sécurité d’envoyer vos données à un tiers. partie à analyser et à renvoyer. Pour certains, ce risque est acceptable, tandis que d’autres préféreraient ne pas impliquer les géants de la publicité sur Internet s’ils n’y sont pas obligés.
Si je traduis sur Google le menu du restaurant de tapas, vais-je commencer à être ciblé pour les promotions de saucisses ? Plus important encore, si quelqu’un traduit des documents d’immigration ou médicaux avec un identifiant et un emplacement d’appareil connus, ICE viendra-t-il frapper à la porte ? Tout faire hors ligne est logique pour quiconque s’inquiète des implications sur la vie privée de l’utilisation d’un fournisseur de cloud pour la traduction, quelle que soit la situation.
J’ai rapidement testé la qualité de la traduction et je l’ai trouvée plus que satisfaisante. Voici un extrait de la première page du média espagnol El País :
Assez bien! Bien sûr, il a traduit El País par « Le Paris » dans le titre de l’onglet, et il y avait beaucoup d’autres formulations douteuses (bien qu’il ait traduit chaque | par « Oh, c’est une bonne chose » — plutôt hilarant). Mais très peu de cela a empêché de comprendre l’essentiel.
Et en fin de compte, c’est ce que la plupart des traductions automatiques sont censées faire : rapporter le sens de base. Pour tout type de nuance ou de subtilité, même un grand modèle de langue peut ne pas être en mesure de reproduire l’idiome, donc une personne bilingue réelle est votre meilleur pari.
La principale limitation est probablement le manque de langues. Google Traduction en prend en charge plus d’une centaine — Firefox Translations en propose même une douzaine : espagnol, bulgare, tchèque, estonien, allemand, islandais, italien, norvégien bokmål et nynorsk, persan, portugais et russe. Cela laisse un peu de côté, mais rappelez-vous que ce n’est que la première version d’un projet par une organisation à but non lucratif et un groupe d’universitaires – pas un produit phare d’un empire Internet mondial de plusieurs milliards de dollars.
En fait, les créateurs sollicitent activement de l’aide en exposant un pipeline de formation pour permettre aux « passionnés » de former de nouveaux modèles. Et ils sollicitent également des commentaires pour améliorer les modèles existants. Il s’agit d’un produit utilisable, mais pas fini de loin !