Back to top

Op zoek naar de ervaringen van ‘Abraham Cohen’ tijdens de Tweede Wereldoorlog, in een database met tientallen personen die dezelfde naam dragen. Netwerk Oorlogsbronnen (NOB) wil gegevens over personen met een relatie tot Tweede Wereldoorlog digitaal vindbaar maken. Maar hoe doe je dat, als  duidelijk moet zijn om wélke Abraham Cohen het gaat? Als zijn verhaal niet verward mag worden met dat van een naamgenoot? Als zijn levensweg uit verschillende collecties naar voren moet komen? En als je met grote hoeveelheden data te maken hebt? NOB zoekt naar een bruikbare standaard voor het beschrijven van biografische gegevens van voornamelijk historische personen.

Zo'n referentiekader of 'ontologie' (een datastructuur met onderlinge relaties door hiërarchische indelingen) is nog niet zo makkelijk te vinden. ICT-projectmanager van NOB Lizzy Jongma: “Veel gestandaardiseerde modellen zijn nuttig voor het bepalen wie wie is. Ze worden vooral gebruikt om een persoon aan een bron te koppelen. Zoals een auteur aan een boek.  Maar juist bij deze modellen mis je de mogelijkheid om fases uit levens te beschrijven”. Wat NOB zoekt is een (inter)nationale Resource Description Framework (RDF)-compatible standaard met voor de NOB-toepassing bruikbare en gedefinieerde velden of ‘elementen’.

Waarom deze wensen? Dat lichten we graag toe:     

(Inter)nationale standaard

NOB wil data kunnen uitwisselen. Met gestandaardiseerde metadata-velden kan dat, omdat anderen ook gebruik maken van dezelfde manier van beschrijven. Een standaard die nationaal of zelfs internationaal toegepast wordt – i.p.v. een gegevens-schema dat door één instelling wordt gebruikt – is wenselijk vanwege de dan bredere mogelijkheden tot uitwisseling. 

Niet elk metadata-schema is een 'standaard': de beschrijving van de betekenis van velden is belangrijk om de data uitwisselbaar te maken. Neem Dublin Core, een standaard voor het beschrijven van digitale content. Alle velden zijn gedefinieerd waardoor iedereen de invulling van de velden op dezelfde manier interpreteert.

RDF

Resource Description Framework (RDF) is een semantisch overkoepelend model. Binnen de omgeving van een RDF worden gegevens uitgewisseld en gerelateerd. Het is een technische standaard van het World Wide Web Consortium (W3C), het internationale orgaan voor internetstandaarden. Kenmerkend is dat het model geënt is op de betekenis van termen. Onder de koepel van een RDF kunnen dan ook verschillende ontologieën - zoals SKOS, Dublin Core en FOAF - door elkaar gebruikt worden.

‘Semantisch’ betekent dat als er gezocht wordt op bijvoorbeeld ‘Prins Bernhard’, de collectiedata niet plat gescand wordt op deze term. Het is duidelijk dat de woorden een persoon omschrijven en geen ding of gebeurtenis. Semantisch betekent ook dat er een relatie wordt gelegd tussen zijn biografische gegevens en bijvoorbeeld andere personen, plaatsen of gebeurtenissen.   

Bruikbare velden

Waar moeten de velden aan voldoen om bruikbaar te zijn voor NOB? De persoonsgegevens die we willen ontsluiten bevatten meer dan alleen een geboorte-, huwelijks- en sterftedatum. Bijvoorbeeld ook informatie over waar iemand woonde of verbleef, werkzaamheden voor wellicht het verzet, transportatiegegevens, religie, etc. De biografische ontsluiting bevat dus feiten en beschrijvingen over een bepaalde periode uit iemand leven. Hier zijn geschikte velden voor nodig.  

Zoektocht

De standaard moet dus bruikbare en gedefinieerde velden bevatten en te combineren zijn met andere ontologieën. Er blijken weinig geschikte schema’s te zijn voor het standaardiseren van biografische gegevens van historische personen. Dat komt waarschijnlijk omdat er nog niet veel behoefte is aan uitwisseling van persoonsgegevens tussen erfgoedinstellingen. Op dit moment onderzoekt Lizzy de mogelijkheden van BIO en bekijkt ze:

Friend of a Friend (FOAF) wordt veel gebruikt, maar is eigenlijk bedoeld voor sociale media-profielen. Zo zijn er bijvoorbeeld velden voor ICQ-namen en Gmail-accounts, etc. Dit is weinig bruikbaar bij de ontsluiting van historische personen.

BioDes is een schema van het Huygens/ING instituut e.a., gemaakt ten behoeve van het Biografisch Portaal. Lizzy: “Deze set komt op dit moment het dichtste bij waar ik naar op zoek ben voor NOB”. De vraag is nu of dit schema voldoende breed gedragen wordt.

Verder onderzoek naar een bruikbare standaard voor persoonsgegevens volgt. We zijn ook erg benieuwd naar de inzichten van anderen. Hier een overzicht van ontologieën die we gaan bekijken. Dezelfde ervaring, tips of vragen over dit onderwerp? Mail Lizzy!

De NOB-personenportal wordt onderdeel van de digitale infrastructuur van Netwerk Oorlogsbronnen: een thematische ontsluiting van (inter)nationale bronnen uit en over de Tweede Wereldoorlog. De mogelijkheid persoonsgegevens digitaal te verbinden creëert nieuwe onderzoeksomstandigheden: het maakt grote trendanalyses mogelijk. Gegevens over één persoon uit verschillende collecties, of over één familie, maar misschien ook over bewoners van één straat, leden van één sportclub of bibliotheek, kunnen digitaal met elkaar in verband worden gebracht. Bij uitstek een bron voor prosopografisch onderzoek. 

De personenportal zal in eerste instantie vanwege privacy-restricties alleen in een beschermde omgeving voor deelnemende organisaties beschikbaar zijn.