Grâce à une application Web gratuite appelée calligrapher.ai, n’importe qui peut simuler l’écriture manuscrite avec un réseau de neurones qui s’exécute dans un navigateur via JavaScript. Après avoir tapé une phrase, le site la rend sous forme d’écriture manuscrite dans neuf styles différents, chacun étant réglable avec des propriétés telles que la vitesse, la lisibilité et la largeur du trait. Il permet également de télécharger l’échantillon de fausse écriture résultant dans un fichier vectoriel SVG.
La démo est particulièrement intéressante car elle n’utilise pas de police. Les polices de caractères qui ressemblent à de l’écriture manuscrite existent depuis plus de 80 ans, mais chaque lettre apparaît comme un doublon, peu importe le nombre de fois que vous l’utilisez.
Au cours de la dernière décennie, les informaticiens ont assoupli ces restrictions en découvrant de nouvelles façons de simuler la variété dynamique de l’écriture humaine à l’aide de réseaux de neurones.
Créé par le chercheur en apprentissage automatique Sean Vasquez, le site Web Calligrapher.ai utilise les recherches d’un article de 2013 d’Alex Graves de DeepMind. Vasquez a initialement créé le site Calligrapher il y a des années, mais il a récemment attiré plus d’attention avec une redécouverte sur Hacker News.
Calligrapher.ai « dessine » chaque lettre comme si elle était écrite par une main humaine, guidée par des poids statistiques. Ces poids proviennent d’un réseau neuronal récurrent (RNN) qui a été formé sur la base de données d’écriture manuscrite en ligne IAM, qui contient des échantillons d’écriture manuscrite de 221 personnes numérisées à partir d’un tableau blanc au fil du temps. En conséquence, le modèle de synthèse d’écriture Calligrapher.ai est fortement adapté à l’écriture en anglais, et les utilisateurs de Hacker News ont signalé des difficultés à reproduire les signes diacritiques que l’on trouve couramment dans d’autres langues.
Puisque l’algorithme produisant l’écriture manuscrite est de nature statistique, ses propriétés, telles que la « lisibilité », peuvent être ajustées dynamiquement. Vasquez a décrit le fonctionnement du curseur de lisibilité dans un commentaire sur Hacker News en 2020 : « Les sorties sont échantillonnées à partir d’une distribution de probabilité, et l’augmentation de la lisibilité concentre efficacement la densité de probabilité autour de résultats plus probables. Vous avez donc raison de dire que cela ne fait que modifier la variation. Le technique générale est appelée « ajustement de la température de la distribution d’échantillonnage ».
Avec les réseaux de neurones qui s’attaquent désormais au texte, à la parole, aux images, à la vidéo et maintenant à l’écriture manuscrite, il semble qu’aucun coin de la production créative humaine ne soit hors de portée de l’IA générative.
En 2018, Vasquez a fourni le code sous-jacent qui alimente la démo de l’application Web sur GitHub, afin qu’elle puisse être adaptée à d’autres applications. Dans le bon contexte, cela peut être utile pour les graphistes qui veulent plus de flair qu’une police de script statique.