Het Stadsarchief Mechelen zet een innovatieve stap in de ontsluiting van historische documenten door het inzetten van Transkribus, een AI-gebaseerde tekstherkenningssoftware. Deze technologie maakt het mogelijk om handgeschreven teksten om te zetten in doorzoekbare digitale tekst. Hierdoor wordt eeuwenoude informatie toegankelijker voor zowel onderzoekers als het brede publiek.
Het Stadsarchief bevat miljoenen handgeschreven documenten, gaande van oorkonden en brieven tot schepenregisters en stadsrekeningen. De oudste stukken gaan terug tot de 12e eeuw. De leesbaarheid van deze historische documenten vormt vaak een struikelblok, waardoor het opzoeken en analyseren van informatie tijdrovend en complex is. Daar komt nu verandering in.
Digitale schatkamer
Momenteel is er een project lopende waarmee door de inzet van AI, eeuwenoude handschriften worden omgezet in digitale tekst. Door het digitaliseren en automatisch transcriberen van deze teksten kunnen geïnteresseerden straks sneller en eenvoudiger door de rijke geschiedenis van Mechelen grasduinen.
“Mechelen heeft een ongelooflijk rijke geschiedenis, maar veel daarvan zit verstopt in moeilijk leesbare oude documenten. We hebben de ambitie om erfgoed dichter bij de mensen te brengen. Dit project doet dat op een heel vernieuwende manier: we halen oude documenten uit de archieven en maken ze digitaal leesbaar voor iedereen. Via deze digitale schatkamer kan je vanuit je zetel thuis de geschiedenis van Mechelen ontdekken. Dat betekent dat Mechelaars makkelijker hun familiegeschiedenis kunnen opzoeken, studenten sneller informatie vinden, en onderzoekers efficiënter te werk kunnen gaan. Erfgoed is er voor iedereen, niet alleen voor historici”, klinkt het bij Greet Geypen, schepen van Erfgoed.
Vrijwilligers trainen AI
Daarnaast loopt er nog een tweede soortgelijk project binnen het Stadsarchief. Postdoctoraal onderzoekster Nena Vandeweerdt, die tijdelijk in Boston woont, werkt samen met een groep archiefvrijwilligers – Willem Miseur, Paul Behets en Fernand Maes – aan het digitaal beschikbaar maken van een kleine eeuw aan schepenregisters (1480-1560). Deze samenwerking zorgt voor een opschaling van formaat, waardoor op korte termijn nog meer moeilijk leesbare handschriften beter leesbaar worden.
Wat dit project uniek maakt, is dat de AI niet alleen teksten omzet, maar dankzij de correcties van vrijwilligers ook ‘getraind’ wordt. Door de verbeteringen leert het systeem steeds beter omgaan met de specifieke kenmerken van het oude handschrift. Waar de AI in het begin nog veel fouten maakt, worden die door deze correcties steeds minder, waardoor het systeem met elke aanpassing slimmer wordt. In de loop van dit jaar zullen ongeveer 15.000 doorzoekbare transcripties beschikbaar worden gesteld via het archiefbeheersysteem.
“Het AI-project is eigenlijk alleen maar mogelijk dankzij de inzet van onze archiefvrijwilligers. Het is door hun dagelijkse en onafgebroken inzet dat de AI-modellen kunnen worden getraind. Deze vrijwilligers hebben door hun uitgebreide kennis van paleografie of ‘oudschriftkunde’ de vaardigheden in huis om de AI-software ‘op te leiden’. Hun werk vormt de sleutel tot het succes van dit project. Op termijn is het onze ambitie om met het Stadsarchief Mechelen een van de beste leerlingen van de Belgische ‘stadsarchievenklas’ te worden als het gaat om digitale ontsluiting op basis van artificiële intelligentie”, aldus Greet Geypen.
Een eerste testversie is reeds te bekijken via https://app.transkribus.org/sites/stadsarchiefmechelen. Later dit jaar worden de resultaten ook geïntegreerd in het archiefbeheersysteem, zodat ze optimaal doorzoekbaar worden.
Meer info is terug te vinden op https://stadsarchief.mechelen.be/ en de sociale mediakanalen van het Stadsarchief Mechelen.