Vous entendez cela? C’est le son des gens partout qui disent « ils peuvent faire ça ? » après avoir lu comment les chercheurs ont utilisé l’imagerie, la vision par ordinateur et l’apprentissage automatique pour lire un texte romain ancien dans ce que la plupart penseraient n’être qu’un bâton de fusain en le regardant.
Ce rouleau vieux de 2 000 ans est l’un des plus de 800 découverts dans les ruines d’Herculanum, une ville romaine ensevelie par l’éruption du Vésuve en 79 après JC. Carbonisé par l’éruption, chaque rouleau est incroyablement fragile et toute tentative d’ouverture un pour voir s’il est lisible d’une manière ou d’une autre s’est terminé dans un désordre en ruine. Pourtant, les chercheurs ont tenu à percer les secrets contenus dans ces parchemins, et il semble que l’apprentissage automatique ait pu s’avérer la clé pour y parvenir.
Premièrement, le parchemin lu par les chercheurs a été déballé virtuellement. Ce processus complexe consiste à scanner le parchemin, qui a eu lieu dans un accélérateur de particules près d’Oxford, au Royaume-Uni. Ensuite, ces couches froissées ont été déployées pour former ce qui équivaut à des couches plates de papyrus, toujours virtuellement, bien sûr.
« Les photos radiographiques sont transformées en un volume 3D de voxels à l’aide d’algorithmes de reconstruction tomographique, ce qui donne lieu à une pile d’images en tranches », indique la page Web du Vesuvius Challenge.
Ensuite, une étape appelée Ink Detection a été réalisée sur les couches déployées, et celle-ci utilise un modèle d’apprentissage automatique pour identifier les régions encrées du papyrus.
Diverses équipes de chercheurs ont ensuite tenté d’extraire le texte des rouleaux dans le cadre de ce qu’on appelle le Vesuvius Challenge. Chaque équipe a utilisé diverses méthodes, modèles et améliorations des méthodes développées précédemment pour tenter de découvrir davantage ce que cachent ces parchemins. Chaque équipe avait ensuite jusqu’au 1er janvier 2024 à minuit pour soumettre ses résultats afin de participer au défi avant qu’une équipe d’« éminents papyrologues » n’examine chaque candidature pour vérifier les résultats. L’équipe gagnante a remporté 700 000 $.
L’équipe gagnante, composée de Youssef Nader, Luke Farritor et Julian Schillinger, a présenté une proposition qui a été considérée par tous les juges comme la plus lisible du lot. Voici comment ils ont procédé, selon un non-éminent et non-papyrologue (moi).
L’approche de l’équipe s’appuie sur une découverte antérieure d’un motif de crépitement, découvert par Casey Handmer l’année dernière. Cela a ensuite été développé par Luke Farritor, qui a utilisé une GTX 1070 dans le cadre de ses efforts primés les plus récents. D’autres équipes de chercheurs, dont un autre membre de l’équipe gagnante, Youssef Nader, ont également construit d’excellents modèles d’apprentissage automatique pour détecter l’encre à l’aide de fragments de rouleaux tombés, bien que ceux-ci ne semblent fonctionner correctement que sur des fragments et non sur des papyrus enroulés. .
L’équipe gagnante a utilisé la connaissance combinée de ces approches pour produire les résultats les plus clairs avec les restes de parchemin enroulés.
« La soumission contient les résultats de trois architectures de modèles différentes, chacune soutenant les conclusions des autres, les images les plus fortes provenant souvent d’un modèle basé sur TimeSformer… En plus d’une détection d’encre sans précédent, la soumission gagnante contenait l’approche d’auto-segmentation la plus puissante que nous ayons jamais conçue. que j’ai vu à ce jour. »
Environ 5 % du premier parchemin a désormais été lu grâce à l’ensemble du travail de toutes les équipes de chercheurs travaillant sur ce sujet friable. C’est pourquoi le Grand Prix Vesuvius Challenge 2024 a été annoncé, avec l’objectif ambitieux de passer des 5 % désormais connus à 90 % des quatre rouleaux numérisés.
Il y a donc certainement du travail à faire pour mieux comprendre cela, mais aujourd’hui encore, les chercheurs ont une idée de ce que cela dit : « comme dans le cas de l’alimentation, on ne croit pas d’emblée aux choses qui sont rares pour être absolument plus agréables que ceux qui sont abondants. »
Oui, tout tourne autour des plaisirs de la vie, ou de ce qu’on appelle l’épicurisme. A savoir, pour cette rubrique du moins, les plaisirs de se bourrer la gueule.