Een leven én een wereldoorlog in events
Hoe kunnen we online-collecties verrijken met ‘events’? En hoe dat te gebruiken in de ontsluiting van het thema Tweede Wereldoorlog én levens van betrokkenen? Daar houdt de Event Working Group zich mee bezig.
Hoe kunnen we online-collecties verrijken met ‘events’ (of in het Nederlands ‘gebeurtenissen’)? Daar houdt de Event Working Group van het nationale platform eHumanities.nl zich mee bezig. NOB’s Lizzy Jongma is één van de werkgroep-leden: “Ik heb grote interesse in het ontwikkelen van semantische modellen voor events. Zowel voor de ontsluiting van het grote thema Tweede Wereldoorlog, als voor het beschrijven van de levens van betrokkenen”. De werkgroep, met leden vanuit NOB, Huygens ING, EHRI/NIOD, VU en UvA verwacht eind 2017 met een bruikbare demonstrator te komen.
Gebruik van event-modelling
Anno 2017 zijn we de tijd voorbij dat we computers alleen gebruiken als tool om collecties digitaal maar handmatig te ontsluiten en verbinden. Machine readable records, full automatic archival access, named entity recognition: automatische ontsluiting door computers komt dichterbij. In dit tijdperk kunnen computers getraind worden om automatisch teksten te lezen, termen te herkennen en in een context te plaatsen. En hebben we te maken met grote hoeveelheden (digitale) data die we willen structureren en koppelen.
Eén van de onderwerpen binnen de digitale collectie-ontsluiting is het toegankelijk maken van historische gebeurtenissen op verschillende niveaus. En dat in de vorm van ‘event-modelling’. Want hoe leer je een computer een naam, geboortedatum en trouwlocatie uit een document te selecteren? Of gebeurtenissen als deportatie, gevangenschap in een kamp, of een overlijden te herkennen? Hoe definieer je deze gebeurtenissen? En hoe leer je een computer dat een overlijden in Auschwitz tussen 1940 en 1945 zeer waarschijnlijk gerelateerd is aan de ‘gebeurtenis’ Tweede Wereldoorlog. Nog verder, hoe geef je de hiërarchie tussen deze micro- en macro-gebeurtenissen vorm?
>>>> paragraph >>>>>
Vragen beantwoorden
Door zich over deze vraagstukken te buigen, hoopt de Event Working Group tot een ‘event-model’ te komen dat collecties verrijkt. Zo worden deze bruikbaarder voor onderzoekers uit de geestes- en sociale wetenschappen. Een aantal vragen die de werkgroep beantwoordt:
- Wat en wanneer is iets een event?
- Hoe laat je een computer events herkennen?
- Hoe bepaal je de plaats van een event in een hiërarchie van micro- en marco-events?
- Hoe koppel je events? Bijvoorbeeld een micro-event als een arrestatie, koppelen aan een macro-event als de Tweede Wereldoorlog?
Waar sommige werkgroep-leden letten op hoe je computers bronnen kunt laten lezen, focust NOB meer op het computer-leesbaar maken van bronnen. Om te kunnen komen tot een demonstrator zijn in januari van dit jaar twee masterstudenten gestart met een use case. Ze bouwen informatie op aan de hand van het Simple Event Model-schema (SEM). Dit Resource Description Framework-model (RDF) gaat uit van een event als het tenminste de variabelen ‘plaats’, ‘tijd’ en ‘één of meer personen’ kent. In juni 2017 presenteren de studenten hun onderzoek.
Verbanden zichtbaar maken
Het modelleren van een macro-event als de Tweede Wereldoorlog aan de hand van (micro)events in een hiërarchie, past goed in de visie van NOB om oorlogsbronnen op semantische wijze te verrijken en toegankelijk te maken. Want het definiëren van gebeurtenissen als events maakt het koppelen van data mogelijk. Daardoor worden verbanden zichtbaar die in de analoge én platte digitale wereld niet eerder zichtbaar waren. Het events-model wordt t.z.t. dan ook toegepast binnen het project personenportal, door beschrijvingen van levens op te bouwen in events. Maar ook juridische trajecten, vastgelegd in het Centraal Archief Bijzondere Rechtspleging (CABR), zijn op te delen in gebeurtenissen.
Lizzy: “mijn wens is om een mate van gedetailleerdheid te bereiken waardoor je uit miljoenen oorlogsbronnen bepaalde bewegingen kan vastleggen. Door bijvoorbeeld vanuit het perspectief van personen typen geweldsevents of transporten te definiëren. De term ‘arrestatie’ komt bijvoorbeeld in veel bronnen voor. Door betekenis toe te kennen aan een aantal waarden rond deze term kun je een computer leren deze gebeurtenis te herkennen als zijnde vallend onder het macro-event Tweede Wereldoorlog. En uiteindelijk kun je bijvoorbeeld binnen de omgeving van de personenportal een transport selecteren en zien welke mensen er mee zijn gegaan”.
Nieuw onderzoek
Event-modelling maakt volledig nieuw onderzoek (van big data) mogelijk. Stel je voor: arrestatiegolven worden zichtbaar, gedefinieerd op type arrestatie (van stelen tot het gebruik van geweld), gefilterd op locatie en de financiële situatie van de arrestant, etcetera. Hoe gedetailleerder je classificeert hoe meer informatie je uit een grote hoeveelheid data kunt halen. De rekenkracht van een computer wordt gebruikt om de aanloop naar gebeurtenissen te laten zien. “En misschien kunnen we innovatieve technieken en computers zo gebruiken dat we in de toekomst bronnen full text door computers laten ontsluiten en alleen nog de herkomst hoeven beschrijven”, sluit Lizzy af.
Eerder schreven we over de zoektocht naar een standaard voor biografische gegevens. Naar aanleiding van die blog is in het najaar van 2016 groep bijeengekomen, bestaande uit Lizzy Jongma (NOB), Annelies van Nispen (EHRI / NIOD), Sebastiaan Derks (Huygens ING) en Renier van de Giessen (Regionaal Archief Nijmegen). Allen liepen we bij de ontsluiting van collecties tegen hetzelfde probleem aan. Geen leven bestaat uit dezelfde gebeurtenissen. En elk besluit kan aan verandering onderhevig zijn. Iemand kan meerdere keren trouwen of na veertig jaar een andere godsdienst gaan belijden. Een standaard met een aantal vaste velden is daarom moeilijk te gebruiken. In een Linked Open Data-wereld is het daarom logischer om te werken met ‘events’ in plaats van vaste velden. Daarmee kunnen relaties wijzigen en events kunnen elkaar opvolgen.