De mensen van TRIADO: Rutger van Koert
Van Koert helpt bij TRIADO mee met het omzetten van het geschreven en/of gedrukte bronmateriaal uit het CABR naar een digitaal leesbare tekst. Daarnaast is hij verantwoordelijk voor het automatisch classificeren van die gedigitaliseerde documenten uit het CABR en verrijkt hij die documenten met metadata. Dit gebeurt aan de hand van geavanceerde software, die in de lopende tekst (plaats)namen, titels, organisaties en datums herkent en classificeert.
Middeleeuwse manuscripten
Bij het Humanities Cluster is Van Koert ook verantwoordelijk voor de software die dit classificeren op vroeg moderne en middeleeuwse manuscripten kan. Dit is onvoorstelbaar ingewikkeld: hoe langer geleden tekst opgeschreven is, hoe moeilijker het wordt om het schrift te identificeren. Tot slot zorgt Van Koert ook voor software die op de scan van een middeleeuws manuscript kan vaststellen of het om de oorspronkelijke tekst gaat of om aantekeningen in de marge. Daarmee kan hij die teksten dus apart laten opslaan.
Een druk op de knop
Volgens Van Koert kunnen onderzoekers straks dankzij de methodes die in TRIADO worden getest, met een enorme tijdwinst interessante onderzoeksgegevens uit de archieven halen en deze vergelijken met informatie uit andere archieven. Door archieven geheel digitaal te ontsluiten, krijg je straks namelijk met één druk op de knop de resultaten die je wilt hebben, in plaats van dat je eerst jaren archiefonderzoek moet doen. Als de methode die nu in het TRIADO-project wordt ontwikkeld goed werkt en zoveel mogelijk is geoptimaliseerd, dan is de kans heel groot dat deze methode ook voor andere archieven werkt. Van Koert: "Wat dit project zo bijzonder maakt, is de schaal waarop we nu testen. We testen nu deze methoden met een set van honderdduizenden scans in plaats van een paar honderd".