L’intelligence artificielle au secours des Archives secrètes du Vatican

Source: FSSPX Actualités

Un nouveau projet basé sur l'intelligence artificielle (IA) devrait bientôt permettre l'accès aux textes manuscrits inconnus d’un des plus grands fonds d’archives historiques au monde.

Les Archives secrètes sont l'une des plus grandes collections historiques au monde. Situées à l'intérieur les murs du Vatican, à côté de la Bibliothèque apostolique et juste au nord de la Chapelle Sixtine, elles abritent plus de 80 km de rayonnages sur lesquels reposent des manuscrits vieux de plus de 12 siècles.

Les Archives contiennent des trésors, tels l’autographe de la Bulle pontificale qui a excommunié Martin Luther, ou les demandes d'aide que la reine Mary Stuart a envoyées au pape Sixte V, peu avant son exécution. En qualité et en quantité, la collection vaticane a peu d’équivalent.

Mais le fonds des Archives secrètes n'est pas vraiment accessible aux chercheurs : rien, ou presque, n’a été numérisé, encore moins retranscrit en caractères informatiques pour une lecture aisée.

Un nouveau projet pourrait tout changer en 2018 et pour les années à venir. Baptisé In Codice Ratio, il utilise la combinaison d’une intelligence artificielle et d’un logiciel de reconnaissance optique de caractères (OCR), afin de décrypter les manuscrits. En cas de succès, cette technique pourrait également être utilisée pour d’autres fonds d’archives, dans le monde entier.

In Codice Ratio contourne tous les problèmes jusqu’ici rencontrés par les logiciels de reconnaissance de caractères, grâce à une nouvelle conception de l'OCR. Désormais, les mots ne sont plus décomposés en lettres, mais en quelque chose de plus proche des coups de crayon individuels. L'OCR repère ainsi chaque mot, et les divise en une série de bandes verticales et horizontales, en fonction des parties les plus minces, celles où il y a moins d'encre. Le logiciel découpe ensuite les lettres en fonction des divisions opérées.

Le résultat de ce premier traitement aboutit à une série de pièces de puzzle que l’intelligence artificielle recompose à son tour, afin de faire apparaître enfin le manuscrit retranscrit dans son intégrité.