5 maart 2019

Handschriftherkenning voor Stadsarchief Amsterdam

Laatste update: 5 mrt '19 - 14:14

“We hebben 3,5 kilometer aan notarieel archief” vertelt Ellen Fleurbaay van Stadsarchief Amsterdam. In de donkere depots van het Stadsarchief Amsterdam ligt het archief van de Amsterdamse Notarissen 1578-1915.  Dit archief bevat miljoenen akten met daarin veel nog onbekende details over Amsterdammers en hun internationale netwerken. Via het project ‘Crowd leert computer lezen’ zijn handgeschreven notarisakten uit drie eeuwen volledig getranscribeerd en doorzoekbaar. Dit is mogelijk door handschriftherkenning en machine learning.  

Verhalen over bekende en onbekende Amsterdammers

Met steun van het Mondriaan Fonds en in samenwerking met het Huijgens ING ging begin 2018 het project ‘Crowd leert computer lezen’ van start. Het doel van het project is om geautomatiseerd transcripties te maken van handgeschreven documenten uit de archieven. Zo wordt het mogelijk om meer te leren over bekende en onbekende Amsterdammers en passanten, (internationale) handel, scheepvaart, slavernij, persoonlijk bezit en erfenissen, machtigingen en wisselprotesten. Maar ook ooggetuigenverslagen van ontberingen op zee, ordinaire burenruzies of knokpartijen in herbergen en illegale speelhuizen.

Schrifttekens omzetten naar moderne tekens

Stadsarchief Amsterdam wil de akten en verhalen aan het brede publiek laten zien. Voor het transcriberen van de documenten is Transkribus gebruikt. Deze techniek is ontwikkeld door Universiteit Innsbruck en onderdeel van het door de Europese Unie gesubsidieerde project READ. Transkribus moest de handschriften van de notarissen leren lezen. Hiervoor werden er van vijftien notarissen 100-500 akten handmatig getranscribeerd door vrijwilligers. Dit zorgde voor een model dat schrifttekens kan omzetten naar moderne tekens. Vervolgens heeft de machine miljoenen akten met dit model getranscribeerd.

Handschriftherkenning
Voorbeeld van een 18e-eeuwse akte.

Op 11 maart wordt het project gelanceerd op velehanden.nl. Hier kan iedereen helpen met het controleren van de documenten. Door de fouten te corrigeren, wordt de validiteit verbetert. Het Stadsarchief Amsterdam is niet de enige die bezig is met geautomatiseerde handschriften herkenning. Ook Noord-Hollands Archief en het Utrechts Archief zijn bezig met deze techniek.

Digitalisering en Cultuur

Ellen Fleurbaay van het Stadsarchief Amsterdam presenteerde op de DEN-conferentie in Rotterdam. Dit is een tweedaagse conferentie over digitalisering en cultuur.