2.4 - De Waardelijstontologie

OVERZICHT

Waardelijstontologie

De waardelijstontologie definieert resources die betrekking hebben op waardelijsten. Deze resources worden alleen gebruikt in de (RDF-varianten van) de waardelijsten, en in de definities van waardelijsten. Daarbij gaat het onder meer om klassen die staan voor de verschillende subtypen van waardelijsten die we onderscheiden, zoals conceptwaardelijsten en registerwaardelijsten. Ook worden diverse properties gedefinieerd die specifiek zijn voor waardelijsten. 

De waardelijstontologie importeert SHACL met owl:imports. Alle klassen zijn gedefinieerd als instantie van rdfs:Class en tevens van sh:NodeShape. Daarmee krijgen deze resources zowel een semantische als een syntactische karakerisering. In de hoedanigheid van sh:NodeShape hebben ze een aantal property-shapes die aangeven welke cardinaliteit een property heeft. Dit wordt gebruikt om een modelgedreven formulier te kunnen genereren ten behoeve van het waardelijstgeneratieproces.

Waardelijst, Registerwaardelijst, Conceptwaardelijst

Binnen TOOI verstaan we onder een waardelijst een selectie van informatie in het kennismodel die een applicatiespecifiek doel dient, in de vorm van een (geserialiseerde) RDF-graaf, een XML-document, en eventueel nog in andere formats. Meer in het bijzonder is een waardelijst een  selectie van feiten over een selectie van resources. Een voorbeeld is een waardelijst met gemeenten die bestaan op een bepaalde datum. Deze beschrijft de betreffende resources — namelijk gemeenten zoals geïdentificeerd met een TOOI-URI — in termen van hun officiële namen en enige andere eigenschappen. Waardelijsten zijn toepassingspecifiek en worden gegenereerd uit gegevensverzamelingen die niet toepassingspecifiek zijn. Deze gegevensverzamelingen zijn per definitie RDF-grafen die deel uitmaken van het TOOI-kennismodel.

We onderscheiden verschillende soorten waardelijsten, elk met eigen kenmerken. Het meest prominente onderscheid is tussen registerwaardelijsten en conceptwaardelijsten. Een registerwaardelijst beschrijft resources van het specifieke type dat in het betreffende register de focus heeft. Voor het provincieregister zijn dat bijvoorbeeld provincies. Een conceptwaardelijst beschrijft resources van het type skos:Concept en vormt een selectie van uitspraken (weergegeven als RDF-triples) zoals deze zijn vastgelegd in de TOOI-thesauri.

Een voorbeeld. De volgende uitspraken worden beheerd in provincie, het provincieregister. Deze uitspraken worden gekopieerd in de de waardelijst <``https://identifier.overheid.nl/tooi/set/provincie_peildatum/v1``> en in andere waardelijsten die afgeleid worden uit het register.

Voorbeeld van uitspraken die uit een register in een registerwaardelijst gekopieerd worden

provincie:pv26 a tooiont:Provincie;
  rdfs:label "provincie Utrecht";
  tooiont:officieleNaamExclSoort "Utrecht";
  tooiont:officieleNaamInclSoort "provincie Utrecht";
  tooiont:officieleNaamSorteer "Utrecht";
  tooiont:organisatiecode "pv26";
  tooiont:organisatiesoort tooikern:c_358e6463;
  tooiont:owmsId "http://standaarden.overheid.nl/owms/terms/Utrecht_(provincie)"^^xsd:anyURI;
  tooiont:provinciecode "26";
  tooiont:voorkeursnaamExclSoort "Utrecht";
  tooiont:voorkeursnaamInclSoort "provincie Utrecht";
  tooiont:voorkeursnaamSorteer "Utrecht" 
.

Waardelijsten vatten we op als instanties van een specifieke subklasse van tooiont:Informatieobject, te weten tooiwl:Waardelijst, met de subklassen tooiwl:RegisterWaardelijst en tooiwl:ConceptWaardelijst.

Historie, Zichtdatum, Peildatum

Een waardelijst is een selectie van informatie in het kennismodel, en het kennismodel verandert in de tijd. Nieuwe feiten worden aan het kennismodel toegevoegd, andere feiten verdwijnen uit het kennismodel. De toestand van het kennismodel — dus de feiten die daarin op dat moment vastliggen — wijzigt voortdurend. Als we een waardelijst genereren maken we een selectie van de feiten die op dat moment het kennismodel vormen.  Dat moment noemen we de zichtdatum. De zichtdatum van een waardelijst is dus de datum waarop het kennismodel beschouwd wordt. Het is de datum die op basis van de toestand van het kennismodel op dat moment bepaalt wat in de waardelijst wel en niet opgenomen wordt. In het normale geval zal de zichtdatum gelijk zijn aan het moment dat de waardelijst gegenereerd wordt. Het is ook denkbaar dat op basis van "huishoudelijke" informatie over wie wanneer wat heeft aangepast in het kennismodel, een waardelijst geregenereerd wordt met een zichtdatum in het verleden. Vooralsnog zijn er geen concrete plannen om dit ook te realiseren.

Binnen de TOOI-registers wordt historie bijgehouden. Als een gemeente opgeheven wordt, dan wordt deze gebeurtenis vastgelegd. De informatie over de opgeheven gemeente (wat de naam was, in welke provincie deze lag) blijft beschikbaar. Gebeurtenissen zoals opheffing en oprichting kunnen ook met vooruitwerkende kracht worden vastgelegd. Een register bevat op elk moment dus resources die op dat moment bestaan, niet meer bestaan, of zullen bestaan. Omdat we soms alleen geïnteresseerd zijn in resources die op een bepaald moment bestaan definiëren we ook de notie peildatum. De peildatum is een datum waarmee precies die resources geselecteerd worden die, voor zover op de zichtdatum bekend in het kennismodel, op die peildatum bestaan.

Binnen de TOOI-thesauri wordt geen historie bijgehouden. Als je op zeker moment een thesaurus bekijkt, dan bevat deze precies de concepten die op dat moment bestaan. In dat geval is het onderscheid tussen peildatum en zichtdatum subtiel. Zoals we straks zullen zien heeft dit te maken met het begrip geldigheid.

Om de begrippen zichtdatum en peildatum uit te drukken definiëren we de properties tooiont:zichtdatum en tooiont:peildatum. Deze hebben tooiont:Informatieobject als exclusief domein. Dat betreft dus alle soorten informatieobjecten, hoewel tooiont:peildatum alleen voor bepaalde soorten waardelijsten relevant is.

In de volgende paragrafen gaan we in meer detail in op respectievelijk registerwaardelijsten en conceptwaardelijsten. We zullen de begrippen zichtdatum en peildatum met voorbeelden nader toelichten en de relatie met het begrip geldigheid analyseren.

WAARDELIJSTEN

Registerwaardelijsten

De klasse tooiwl:RegisterWaardelijst is een subklasse van tooiwl:Waardelijst. Van de registerwaardelijsten kennen we twee varianten: de waardelijst op peildatum en de waardelijst-compleet. We definiëren hiervoor de volgende subklassen van tooiwl:RegisterWaardelijst:

  • tooiwl:RegisterWaardelijstOpPeildatum
  • tooiwl:RegisterWaardelijstCompleet

De waardelijst-compleet beschrijft voor zover op de zichtdatum bekend in het kennismodel alle resources (van het betreffende type) die op de zichtdatum bestaan , alle resources die in het verleden hebben bestaan tot aan de zichtdatum, en alle resources die in de toekomst zullen bestaan, na de zichtdatum.

De waardelijst op peildatum beschrijft (eveneens voor zover op de zichtdatum bekend in het kennismodel) alleen die resources die op de peildatum bestaan. In veel gevallen zal bij een waardelijst op peildatum de zichtdatum gelijk zijn aan de peildatum. Wat regelmatig voorkomt is dat we een waardelijst gemeenten op peildatum publiceren, waarbij de peildatum een paar maanden in de toekomst ligt. Voor de waardelijst gemeenten compleet doet alleen de zichtdatum er toe. Een voorbeeld.

Neem de waardelijst gemeenten-compleet gegenereerd op 1 november 2028. Die datum is tevens de zichtdatum voor die waardelijst. Het is toevallig ook de datum waarop de lijst is gepubliceerd. In het gemeenteregister zijn op dat moment al sinds een week of twee een aantal gemeentelijke herindelingen geregistreerd die ingaan op 1 januari 2029 — dus met vooruitwerkende kracht. Zo ook de (uiteraard fictieve) vorming van de gemeente Windhoek. De waardelijst zal dus informatie bevatten over de gemeente Windhoek, inclusief de op het moment van publicatie nog toekomstige datum van oprichting van deze gemeente.  Op 1 maart 2029 wordt een nieuwe waardelijst gemeenten compleet gemaakt en gepubliceerd, dus met zichtdatum 1 maart 2029. Eind februari 2029 is namelijk bekend geworden dat er een gemeentelijke herindeling die per 1 september 2028 is ingegaan, om onverklaarbare redenen niet is geregistreerd in het gemeenteregister. Deze omissie betreffende de oprichting van gemeente Waaiberg is in februari rechtgezet.

Dat betekent dat de waardelijst gemeenten compleet met zichtdatum 1 november 2028 wel informatie bevat over de gemeente Windhoek, maar niet over de gemeente Waaiberg. De waardelijst gemeenten compleet met zichtdatum 1 maart 2029 bevat informatie over beide. Een dergelijk voorbeeld van een registratie met terugwerkende kracht is voor het gemeenteregister nogal vergezocht, maar vergelijkbare gevallen kunnen en zullen voorkomen in bijvoorbeeld het ZBO-register.

De waardelijst op peildatum beschrijft alleen resources die (voor zover op de zichtdatum bekend) op de peildatum bestaan. Resources die wél geregistreerd zijn maar op de peildatum niet meer of nog niet bestaan worden in waardelijsten van dit type dus niet meegenomen. We publiceren op 1 november 2028 behalve de waardelijst gemeenten compleet ook twee versies van de waardelijst gemeenten op peildatum:

  • Waardelijst gemeenten op peildatum, v1021, met peildatum 1 november 2028. De peildatum is dus gelijk aan de zichtdatum. De waardelijst bevat geen informatie over de gemeente Windhoek, noch over Waaiberg.
  • Waardelijst gemeenten op peildatum, v1022, met peildatum 1 januari 2029. De peildatum ligt ten opzichte van de zichtdatum dus precies twee maanden in de toekomst. De waardelijst bevat informatie over de gemeente Windhoek, inclusief de informatie dat deze gemeente per 1 januari 2029 is opgericht. Omdat op de zichtdatum in het kennismodel nog niets bekend is over de gemeente Waaiberg, bevat de waardelijst over deze gemeente geen informatie.

Er is een sterk verband tussen de begrippen peildatum en geldigheid. Geldigheid krijgt zijn concrete invulling in de context van een specifieke informatiebehoefte, op een specifieke tijd en plaats. Stel, de fictieve gemeente Waaiberg, opgericht per 1 september 2028, is een samenvoeging van een aantal andere gemeenten, onder meer Stormbeek. Wanneer in 2038 een meerderjarige ingezetene van Nederland zijn personalia in moet vullen op een formulier, dan is "Waaiberg" een geldige waarde voor het veld 'woonplaats', en "Stormbeek" een geldige waarde voor het veld 'geboorteplaats'. Andersom niet, uiteraard.

Conceptwaardelijsten

Conceptwaardelijsten beschrijven resources van het type skos:Concept en vormen een selectie van uitspraken (assertions, weergegeven als RDF-triples) zoals deze zijn vastgelegd in de TOOI-thesauri. We kennen twee hoofdsoorten met de bijbehorende subklassen van tooiwl:ConceptWaardelijst:

  • Schemagebaseerd. De selectie van informatie is gebaseerd op een conceptschema: tooiwl:SchemagebaseerdeConceptwaardelijst.
  • Collectiegebaseerd. De selectie is gebaseerd op een conceptcollectie: tooiwl:CollectiegebaseerdeConceptwaardelijst.

Bij een schemagebaseerde waardelijst willen we vastleggen welk schema is gebruikt, bij een collectiegebaseerde waardelijst de collectie. Hiervoor definiëren we de properties tooiwl:schema en tooiwl:collectie.

Binnen de TOOI-thesauri wordt geen historie vastgelegd. Voor thesauri worden wijzigingen releasematig doorgevoerd. Naast de werkversie van de thesaurus (zonder versieaanduiding in de baseURI) wordt bij elke release een geversioneerde afslag gemaakt (met een versieaanduiding in de baseURI). Zie de nadere toelichting op deze punten in het hoofdstuk over thesauri. Dat betekent dat we bij een conceptwaardelijst de zichtdatum vastleggen — in de praktijk is dat de datum van genereren — en geen peildatum.

WAARDELIJSTEN EN HUN PROPERTIES (METADATA)

Bij het genereren van een waardelijst wordt gebruik gemaakt van de betreffende de waardelijstdefinitie (tooiont:Waardelijstdefinitie). Deze definite bevat informatie om metadatawaarden te genereren, maar ook om de selectie van data aan te sturen. De definities ondersteunen de beheerprocessen en worden niet gepubliceerd.  Elke waardelijst die we genereren heeft een aantal metadatawaarden die constant blijven over alle versies van die waardelijst. Daarnaast heeft een versie van een waardelijst metadatawaarden die specifiek zijn voor die versie.

De graphURI van de te genereren waardelijst wordt gevormd door de waarde van de property tooiwl:bestandsnaam in de waardelijstdefinitie vooraf te laten gaat door https://identifier.overheid.nl/tooi/set/ en te concateneren met "/" en een volgnummer, bijvoorbeeld <``https://identifier.overheid.nl/tooi/set/provincie_peildatum/v115``>.

De RDF-variant van een waardelijst heeft de volgende ontologie-annotaties (metadata). Het subject van deze properties is de graphURI. De uitspraken zeggen dus iets over de RDF-graaf. Er is daarom geen waarde opgenomen voor de property dcterms:format, aangezien deze alleen betrekking heeft op een serialisatie van de graaf. Dezelfde graaf heeft meerdere serialisaties (TTL, XML-RDF, JSON-LD).

Property Bij waardelijsttype Bereik Toelichting
tooiont:titel tooiwl:Waardelijst xsd:string De titel van de waardelijst
tooiont:peildatum tooiwl:RegisterwaardelijstOpPeildatum xsd:date De datum waarop alle waarden in de lijst bestaan, voor zover dat op de zichtdatum bekend was
tooiont:zichtdatum tooiwl:Waardelijst xsd:date De datum tot wanneer de informatie waarop de waardelijst is gebaseerd, is bijgewerkt; vooralsnog het datum-deel van prov:generatedAtTime
tooiont:publicatiedatum tooiwl:Waardelijst xsd:date De datum waarop de waardelijst gepubliceerd is
prov:generatedAtTime tooiwl:Waardelijst xsd:dateTime Het tijdstip waarop de waardelijst gegenereerd is (gebaseerd op de systeemtijd)
owl:versionInfo tooiwl:Waardelijst xsd:string Een korte toelichting op de nieuwe versie
dcterms:description tooiwl:Waardelijst xsd:string Een korte, algemene beschrijving van de inhoud van de waardelijst
pav:derivedFrom tooiwl:Waardelijst xsd:anyURI De baseURI van de graaf die de brondata bevat. Dit is altijd de werkversie, niet een geversioneerde afslag. Zie ook tooiwl:afgeleidVanVersie.
tooiwl:afgeleidVanVersie tooiwl:Conceptwaardelijst xsd:anyURI De baseURI van de geversioneerde afslag van de thesaurus, dus de pav:currentVersion van de werkversie waar de waardelijst van af is geleid
tooiwl:volgnummer tooiwl:Waardelijst xsd:integer Het volgnummer
tooiwl:bronversie tooiwl:Conceptwaardelijst xsd:string Het versienummer van de werkversie van de de thesaurus waar de waardelijst van is afgeleid
tooiwl:schema tooiwl:SchemagebaseerdeConceptwaardelijst skos:ConceptScheme Het conceptschema op basis waarvan de waardelijst is gegenereerd
tooiwl:collectie tooiwl:CollectiegebaseerdeConceptwaardelijst skos:Collection De  conceptcollectie op basis waarvan de waardelijst is gegenereerd

Bij het genereren van een nieuwe versie van een waardelijst worden steeds twee varianten aangemaakt: RDF en XML. De RDF-variant wordt bovendien uitgeleverd in drie serialisatieformats: TTL, RDF-XML en JSON-LD. We beschouwen de RDF-variant hierbij als de basisvariant waar de XML-variant van afgeleid is. We illustreren dit aan de hand van het volgende fragment van de waardelijst provincies op peildatum met zichtdatum en peildatum 1 maart 2029 in het format TTL. De metadata van waardelijst zien er dan uit als volgt:

Metadata registerwaardelijst op peildatum

# baseURI: https://identifier.overheid.nl/tooi/set/provincie_peildatum/v115

<https://identifier.overheid.nl/tooi/set/provincie_peildatum/v115>
  a owl:Ontology, tooiwl:RegisterwaardelijstOpPeildatum ;
  ##
  ## vaste metadata (gekopieerd uit de waardelijstdefinitie)
  ##
  pav:derivedFrom <https://identifier.overheid.nl/tooi/id/provincie> ;
  tooiont:verantwoordelijke ministerie:mnre1034 ; 
  tooiont:titel "Waardelijst provincies op peildatum" ;
  dcterms:description "Beschrijft alle provincies die bestaan op de peildatum" ;
  ##
  ## overige metadata, toegevoegd tijdens generatie door redacteur of systeem
  ##
  owl:versionInfo "Op verzoek van diverse afnemers, vanwege de bijzondere datum" ;
  tooiont:peildatum "2029-02-28"^^xsd:date ;
  tooiont:zichtdatum "2029-03-01"^^xsd:date ;
  tooiwl:volgnummer 115 ;
  tooiont:publicatiedatum "2029-03-01"^^xsd:date ;
  prov:generatedAtTime "2029-02-28T14:31:52.21Z"^^xsd:dateTime ;
.

provincie:pv20
  a tooiont:Provincie ;
  rdfs:label "provincie Groningen" ;
  tooiont:officieleNaamExclSoort "Groningen" ;
  tooiont:officieleNaamInclSoort "provincie Groningen" ;
  ## ... meer data hier
.

Een voorbeeld van een conceptwaardelijst:

Metadata collectiegebaseerde conceptwaardelijst

# baseURI: https://identifier.overheid.nl/tooi/set/plooi_documentsoorten/v115

<https://identifier.overheid.nl/tooi/set/plooi_documentsoorten/v115>
  a owl:Ontology, tooiwl:CollectiegebaseerdeConceptwaardelijst ;
  ##
  ## vaste metadata (gekopieerd uit de waardelijstdefinitie)
  ##
  pav:derivedFrom <https://identifier.overheid.nl/tooi/def/thes/kern> ;
  tooiwl:collectie <https://identifier.overheid.nl/tooi/def/thes/kern/skosCollection_0748250c> ;
  tooiont:verantwoordelijke ministerie:mnre1034 ; 
  tooiont:titel "Waardelijst documentsoorten t.b.v. aanlevering Plooi" ;
  dcterms:description "Beschrijft de documentsoorten t.b.v. aanlevering Plooi" ;
  ##
  ## overige metadata, toegevoegd tijdens generatie door redacteur of systeem
  ##
  owl:versionInfo "Nieuw concept toegevoegd aan collectie" ;
  tooiwl:volgnummer 115 ;
  tooiont:publicatiedatum "2029-03-01"^^xsd:date ;
  prov:generatedAtTime "2029-02-28T14:31:52.21Z"^^xsd:dateTime ;
  tooiwl:afgeleidVanVersie <https://identifier.overheid.nl/tooi/def/thes/kern_v1.3>
.
<https://identifier.overheid.nl/tooi/def/thes/kern/skosCollection_0748250c> 
  a skos:Collection ;
  ## ... meer data hier
.

WAARDELIJSTDEFINITIES

Elke waardelijst die we genereren heeft een aantal metadatawaarden die constant blijven over alle versies. Deze leggen we vast in de waardelijstdefinitie voor de betreffende waardelijst. Deze waardelijstdefinitie is een instantie van zowel één van de waardelijstsoorten als van tooiont:Waardelijstdefinitie.

Een waardelijstdefinitie heeft waarden voor de volgende properties:

Property Domein Bereik Definitie
pav:derivedFrom
xsd:anyURI De baseURI van het register of de thesaurus waar de waardelijst uit afgeleid wordt
tooiont:verantwoordelijke tooiont:Informatieobject tooiont:Overheidsorganisatie De organisatie die verantwoordelijk is voor de inhoud van de waardelijst, zoals aangeduid met een TOOI-URI. Vaak (maar lang niet altijd) is dit ministerie:mnre1034 (BZK), het ministerie waar KOOP onder valt
tooiont:titel tooiont:Informatieobject xsd:string De titel van de waardelijst
dcterms:description
xsd:string Een korte, algemene beschrijving van de inhoud van de waardelijst
tooiwl:repository tooiwl:Waardelijst xsd:string De repository die de brondata bevat
tooiwl:bestandsnaam xsd:string xsd:string De string die de betsandsnaam van de waardelijst representeert. Deze vormt de basis bij het genereren van de bestandsnaam en de URI van elke waardelijstversie, waarbij aan de string "/v" en een volgnummer geconcateneerd wordt
tooiwl:collectie tooiwl:Collectiegebaseerde-Conceptwaardelijst skos:Collection De instantie van skos:Collection op basis waarvan de informatie in de waardelijst is geselecteerd
tooiwl:schema tooiwl:Schemagebaseerde-
Conceptwaardelijst
skos:ConceptScheme De instantie van skos:ConceptScheme op basis waarvan de informatie in de waardelijst is geselecteerd