Het waarom van thesauri matchen
Met 'matchen van thesauri' wordt het bij elkaar zoeken van overeenkomende termen in verschillende thesauri bedoeld. Het gaat hier met name om de combinatie van een (interne) instellingsthesaurus en een externe, online gepubliceerde thesaurus, zoals de Art and Architecture Thesaurus (AAT) of, in ons geval, de WO2-thesaurus. Een voordeel hiervan is dat het nu direct duidelijk is, ook voor computers, dat die twee termen hetzelfde zijn. Ook als ze andere woorden voor hetzelfde ding gebruiken (bunker – kazemat).
Waarom is het nuttig om mijn interne met externe thesauri te matchen?
Het handige van het matchen van thesauri, is dat het mogelijk is om via de gelegde links tussen termen, informatie uit de externe thesaurus binnen te halen in het eigen systeem. Zo is het mogelijk om via de link van een AAT-term, naar het eigen systeem de scope note maar ook de Engelse (/Duitse/Spaanse/Chinese) term over te halen. Daarmee wordt de eigen thesaurus verrijkt en verduidelijkt.
Een andere reden voor de links is dat het verduidelijkt welke term er precies mee bedoeld wordt. Er wordt immers direct verwezen naar de scope note van een term op de website van de externe thesaurus. Dit zijn een soort referenties die helpen om bijvoorbeeld homoniemen uit elkaar te houden.
De betekenis van de term 'transport'
Zo heeft het woord ‘transport’ in oorlogscontext een beladen en geheel andere betekenis dan in het normale taalgebruik. Hierbij is het nuttig om de bedoelde betekenis in de thesaurus te verduidelijken, om (pijnlijke) verkeerde toekenningen te voorkomen. In de WO2-thesaurus zijn er daarom twee termen: ‘transport’ voor de normale betekenis en ‘transporten’ voor de specifieke vervolgingsbetekenis. Deze twee concepten hebben een aparte URI, een andere plaats in de thesaurusboom en een scope note waarin het verschil wordt toegelicht.
Uiteraard blijft het mogelijk ook zelf scope notes te maken, wanneer de scope note van een term in een externe thesaurus niet is wat er intern bedoeld wordt. In dat geval wordt ook geen link gelegd met een externe thesaurus.
Matchen voor een verbeterde vindbaarheid
Een volgend voordeel van de links zal de komende jaren steeds duidelijker blijken, als meer en meer collecties met links naar externe thesaurustermen online komen. Wanneer dit soort gedeelde thesaurustermen namelijk in meerdere collecties gebruikt worden, is het makkelijker om overkoepelend in al die collecties te zoeken. Dit zijn voordelen van het ‘semantisch web’ gevormd door linked data. Het Netwerk Digitaal Erfgoed (NDE, ook subsidiegever van het NOB thesaurusproject) heeft een leerzaam en leesbaar rapport (pdf) gepubliceerd over de knowledge graph van erfgoeddata.
Interesse in het gebruik van de WO2-thesaurus en gemotiveerd om ermee aan de slag te gaan? Lees verder over hoe u zich kunt voorbereiden: