Skip to ContentSkip to Navigation
Over ons Actueel Evenementen Promoties

Artificial intelligence in historical document analysis

Pattern recognition and machine learning techniques in the study of ancient manuscripts with a focus on the Dead Sea Scrolls
Promotie:M.A. (Maruf) Dhali, Dr
Wanneer:23 januari 2024
Aanvang:16:15
Promotors:prof. dr. L.R.B. (Lambert) Schomaker, prof. dr. M. (Mladen) Popovic
Waar:Academiegebouw RUG
Faculteit:Science and Engineering
Artificial intelligence in historical document analysis

AI analyseert Dode Zeerollen: Grote Jesaja-rol blijkt onverwachts meerdere auteurs te hebben

Met behulp van kunstmatige intelligentie (AI) wordt het mogelijk om oude geschriften te digitaliseren en te analyseren. In zijn promotieonderzoek werkte Maruf Dhali met gescande afbeeldingen van de Dode Zeerollen. Met een door hem ontwikkeld algoritme, kon Dhali vaststellen dat de Grote Jesaja-rol, een van de langste rollen in de Dode Zeerollen collectie, door meerdere verschillende auteurs is geschreven. Deze bevinding is in strijd is met huidige aannames over het auteurschap van de boekrol, maar wordt ondersteund door twee verschillende, zeer uiteenlopende algoritmes.

Een cruciale verwerkingsstap in de digitalisering van oude geschriften is het visueel scheiden van inkt en de achtergrond. Hiervoor ontwierp Dhali BiNet, een diep neuraal netwerk dat gebruik maakt van multispectrale afbeeldingen; het maakt beter onderscheid dan zijn voorgangers, zeker voor zeer gedegradeerde manuscripten met textuurrijk papier en vele irrelevante beeldonderdelen zoals kleurencalibrators en latere annotaties.

Het BiNet systeem levert ook de beelden voor het proces van schrijfstijl-gebaseerde datering op basis van  koolstofdatering: het Enoch systeem. Enoch is gebaseerd op Bayesiaanse regressie en is in staat om de tijdsperiode van een manuscriptfragment correct te identificeren voor een groot aantal werken: met een gemiddelde foutmarge van 27,9 jaar. Door de beschikbaarheid van deze methode van datering kon Dhali 134 totaal ongedateerde documenten nu wel dateren. Het bleek dat voor 67% van de documenten in deze collectie de tijdschatting van Enoch in lijn is met het oordeel van menselijke experts die de resultaten voorgelegd kregen.

Met zijn proefschrift toont Dhali aan dat de interdisciplinaire combinatie van AI met de kennis van domeinexperts meer begrip oplevert over de schrijvers en de schrijfdatum van oude manuscripten. De combinatie van AI met expertise over de materiaaleigenschappen en historische context maakt nieuwe en betere interpretaties mogelijk over ons verleden en zal nieuwe deuren openen voor toekomstig onderzoek.

Maruf Dhali voerde zijn onderzoek uit bij het Bernoulli Institute for Mathematics, Computer Science and Artificial Intelligence, afdeling Kunstmatige Intelligentie, met financiering van het European Research Council (ERC). Hij vervolgt zijn loopbaan als assistant professor aan de Rijksuniversiteit Groningen.