Google a annoncé aujourd’hui avoir ajouté la prise en charge de 110 nouvelles langues à Google Translate, doublant presque le nombre de langues pouvant être traduites.
L’entreprise a utilisé le grand modèle de langage PaLM 2 pour faciliter ces ajouts.
Dans un article de blog, Isaac Caswell, ingénieur logiciel senior de Google, a affirmé que les langues nouvellement ajoutées sont parlées par plus de 614 millions de personnes, soit environ 8 % de la population mondiale.
Il a noté qu’environ un quart des langues sont originaires d’Afrique, « ce qui représente notre plus grande expansion de langues africaines à ce jour ».
L’article du blog donne également quelques détails sur la philosophie de Google en matière de choix des langues et de décision des dialectes à prendre en charge :
Les langues présentent une immense variation : variétés régionales, dialectes, normes orthographiques différentes. En fait, de nombreuses langues n’ont pas de forme standard unique, il est donc impossible de choisir la « bonne » variété. Notre approche a consisté à donner la priorité aux variétés les plus couramment utilisées de chaque langue. Par exemple, le romani est une langue qui compte de nombreux dialectes dans toute l’Europe. Nos modèles produisent un texte qui se rapproche le plus du romani vallax du sud, une variété couramment utilisée en ligne. Mais il mélange également des éléments venus d’autres pays, comme le Vlax du Nord et le romani des Balkans.
Cette mise à jour porte le nombre total de langues prises en charge par Google Translate à 243, ce qui n’est que le début de l’initiative annoncée de l’entreprise visant à prendre en charge à terme 1 000 langues grâce à l’utilisation de l’IA. Vous pouvez voir la liste complète des langues ajoutées dans une page d’aide publiée par Google.
En revanche, Apple Translate prend en charge 21 langues, bien que ce nombre inclut l’anglais américain et britannique comme options distinctes. Apple a récemment annoncé son intention d’ajouter l’hindi à son application Translate. Bien entendu, Apple et Google adoptent des approches très différentes et ont des niveaux d’investissement différents dans ces outils.