2.2 - Informatieobjecten

OVERZICHT

Definitie en afbakening

Zoals gezegd in de inleiding zijn informatieobjecten — samen met organisaties — de meest centrale objecten in het TOOI-kennismodel. We hanteren een brede definitie van de notie informatieobject en bouwen daarbij voort op de notie information resource zoals beschreven in de W3C-recommendation "Architecture of the World Wide Web, Volume One", zie [1]. We citeren de beschrijving in extenso (boldface toegevoegd):

It is conventional on the hypertext Web to describe Web pages, images, product catalogs, etc. as “resources”. The distinguishing characteristic of these resources is that all of their essential characteristics can be conveyed in a message. We identify this set as “information resources.”

This document is an example of an information resource. It consists of words and punctuation symbols and graphics and other artifacts that can be encoded, with varying degrees of fidelity, into a sequence of bits. There is nothing about the essential information content of this document that cannot in principle be transfered in a message. In the case of this document, the message payload is the representation of this document.

However, our use of the term resource is intentionally more broad. Other things, such as cars and dogs (and, if you've printed this document on physical sheets of paper, the artifact that you are holding in your hand), are resources too. They are not information resources, however, because their essence is not information. Although it is possible to describe a great many things about a car or a dog in a sequence of bits, the sum of those things will invariably be an approximation of the essential character of the resource.

We define the term “information resource” because we observe that it is useful in discussions of Web technology and may be useful in constructing specifications for facilities built for use on the Web.

De W3C-definitie van information resource richt zich de facto op webresources. Daarbij onderscheidt het de eigenlijke informatieresource van de representatie van die resource . We definieren tooiont:Informatieobject als resources waarvan de essentiële karakteristieken overgebracht kunnen worden middels een bericht. Daarmee willen we zeker stellen dat ook informatieobjecten die buiten het web bestaan (zoals *Max Havelaar, of De Koffij-veilingen der Nederlandsche Handel-Maatschappij *en de Auteurswet) binnen de definitie vallen. De klasse tooiont:Informatieobject is een subklasse van prov:Entity en heeft zelf ook subklassen. In eerste instantie zijn dat tooiont:OfficielePublicatie en tooiwl:Waardelijst.

Klasse Subklasse van Definitie
tooiont:Informatieobject prov:Entity Resources waarvan de essentiële karakteristieken overgebracht kunnen worden middels een bericht

Het onderscheid tussen informatieobject en representatie is fundamenteel. De URL of URI https://wetten.overheid.nl/BWBR0001854 identificeert het Wetboek van Strafrecht. Daarnaast is het zo dat je, wanneer de URL "opent" in een browser, je in je browser een representatie van het Wetboek te zien krijgt. Semantisch gezien verwijst de genoemde URI naar het Wetboek: het wetboek is de referent of, ook wel, de denotatie ervan. Het feit dat de webserver een representatie van het Wetboek als inhoud van het antwoordbericht terugstuurt — en niet een 404 of een paar metadata uitgedrukt in tekst of iets anders — is praktisch gezien mooi meegenomen, maar heeft semantisch gezien geen relevantie. Elke URL is een URI, en wel een URI waarmee content opgehaald kan worden. De W3C-recommendation "Architecture of the World Wide Web, Volume One" van W3C" [1] formuleert een aantal principes waaraan de semantiek en werking van URIs en URLs aan zouden moeten voldoen, speciaal in de context van informatieobjecten. Het TOOI-kennismodel voldoet waar mogelijk aan deze principes.

Twee verschillende URIs kunnen naar dezelfde resource verwijzen. In dat geval zijn dit aliassen. Aliassen moeten indien mogelijk vermeden worden — dat lukt niet altijd. Een informatieobject kan statisch en onveranderlijk zijn, maar er zijn ook informatieobjecten die voortdurend veranderen. Dat betekent dat het informatieobject op verschillende momenten verschillende representaties heeft. Het kan daardoor voorkomen dat twee verschillende informatieobjecten tijdelijk dezelfde representatie hebben. De URIs van deze informatieobjecten zijn dan nadrukkelijk geen aliassen. Een voorbeeld: de URI http://weather.example.com/oaxaca verwijst naar de weersverwachtingen voor Oaxaca. Dit informatieobject verandert elke dag. De weersverwachting voor Oaxaca op 1 augustus 2004 wordt beschikbaar gemaakt als een afzonderlijke, statische resource met een eigen URI. De twee URIs zijn geen aliassen, ook al hadden de resources waarnaar ze verwijzen op de genoemde datum tijdelijk dezelfde representatie. Zie [1], paragraaf 2.3.2.

Informatieobjecten kunnen complexe relaties met elkaar hebben. Van een informatieobject kunnen verschillende inhoudelijke versies bestaan, het kan vertaald zijn of door een redacteur bewerkt of geanonymiseerd, het kan geleverd worden in diverse vormen. Dit zijn allemaal informatieobjecten.

Wanneer we binnen de huidige context over informatieobjecten spreken hebben we het uit de aard van de zaak primair over overheidsinformatie.

[1] https://www.w3.org/TR/webarch/

Klassediagram

Het onderstaande klassediagram toont de genoemde klassen en hun samenhang. In het diagram is ook te zien dat we twee manieren hanteren om informatieobjecten te classificeren: met subklassen en met concepten.

In het hiernavolgende bespreken we de diverse onderdelen van het model in detail. Daarbij gaan we in op de diverse properties en illustreren we een en ander aan de hand van voorbeelden.

Relatie tot OWMS, FRBR, STOP en andere modellen

Een algemeen probleem met informatieobjecten is dat er zoveel verschillende soorten zijn. Dat maakt het moeilijk om de eigenschappen van een informatieobject in algemene, uniforme termen te beschrijven. Een rechterlijke uitspraak heeft een uitspraakdatum, een wetswijziging niet — die heeft wel weer een datum inwerkingtreding. We munten daarom een beperkt aantal algemene eigenschappen die een min of meer uniforme betekenis hebben binnen het domein van officiële overheidsinformatie, aangevuld met eigenschappen die specifiek zijn voor een subklasse.

Dit is een verschil met OWMS, waar negen generieke eigenschappen uit de Dublin Core-standaard verplicht worden gesteld als metadatadata-elementen. De ervaring heeft geleerd dat het lastig is om een eigenschap als dcterms:creator voor elk willekeurig informatieobject op een consistente en eenduidige manier van een waarde te voorzien. Daarom is het advies bij OWMS ook om applicatieprofielen te maken voor specifieke documenttypen. In TOOI verschuift de nadruk van Dublin Core naar PROV-O, wordt het aantal generiek toe te passen eigenschappen beperkt, en worden er meer eigenschappen gedefinieerd die specifiek zijn voor een subklasse. Daarbij is geldende regelgeving een belangrijk uitgangspunt.

Ook zijn we terughoudend met het gebruik van FRBR, een veelgebruikt conceptueel model om informatieobjecten in te delen in werk, expressie, manifestatie of item. De exacte criteria die bepalen welke informatieobjecten als werk of juist als expressie getypeerd moeten worden zijn afhankelijk van het type informatieobject en van het soort processen die de levensloop van informatieobjecten van dat type bepalen. ELI, de Europese RDF-ontologie voor de representatie van nationale wetgeving, onderscheid 'LegalResource' en 'LegalExpression', maar laat het aan de gebruiker van de standaard om te kiezen of het van toepassing is en zo ja, hoe dit onderscheid uitvalt voor de betreffende wetgeving. Zie [1]. Daarmee kunnen verschillende gebruikers in dezelfde omstandigheden verschillende keuzes maken. En dat kan op zijn beurt leiden tot het in de inleiding genoemde probleem van "false agreement".

Binnen de STOP-standaard wordt eveneens uitvoerig gebruik gemaakt van FRBR. Het toepassingsgebied van STOP is nauw omschreven en de informatieobjecten in het domein zijn in hoge mate uniform. Daarom is het onderscheid dat STOP maakt tussen de verschillende FRBR-typen helder en eenduidig. Om het verband tussen TOOI en STOP duidelijk te maken wordt in het vervolg bij elke eigenschap aangegeven op welke "FRBR-niveaus" de eigenschap normaal aangrijpt. De typologie zelf is alleen daar waar strikt noodzakelijk doorgevoerd in de TOOI-ontologie.

Een potentiële bron van verwarring is het verschil in de definitie van 'informatieobject'. In de TOOI-ontologie zijn dit, zoals hierboven uiteengezet, documenten, bestanden, afbeeldingen en dergelijke. STOP gebruikt deze term uitsluitend om te verwijzen naar niet-tekstuele resources die bij een officiële publicatie horen maar daar geen deel van uitmaken, zoals een geometrieobject of een gehyperlinkte video. Een ander belangrijk verschil is dat STOP een gedetailleerd en fijnmazig model hanteert voor het beschrijven van de levensloop van omgevingsbesluiten. De TOOI-ontologie volgt in deze context de Regeling Elektronische Publicaties (zie verderop), en ziet daarom primair op het besluit of regeling als gepubliceerde resource. STOP en TOOI kunnen zonder problemen in combinatie met elkaar gebruikt worden. Oog voor de terminologische verschillen is daarbij uiteraard van belang.

[1] https://op.europa.eu/en/publication-detail/-/publication/8159b75d-5efc-11e8-ab9c-01aa75ed71a1/language-en/format-PDF/source-121709777, p. 34.

INFORMATIEOBJECTEN EN HUN PROPERTIES

Dit hoofdstuk gaat in op de algemene metadata voor informatieobjecten. In het volgende hoofdstuk zoomen we in op de subklassen van tooiont:Informatieobject en de metadata specifiek voor deze subklassen zijn.

De Regeling elektronische publicatie (REP) schrijft voor welke metadata moeten worden opgenomen bij informatieobjecten gepubliceerd in de publicatiebladen, dus instanties van de subklasse officiële publicatie. Een aantal van de betreffende properties zijn echter niet specifiek voor deze subklasse. Zo is bijvoorbeeld de property tooiont:titel ook van toepassing op andere informatieobjecten. We kiezen ervoor om in zulke gevallen een generieke TOOI-property te definitiëren die indien toegepast op een officiële publicatie de implementatie vormt van de REP-specificatie. Het gevolg daarvan is dat de definitie die we in TOOI hanteren soms afwijkt van de definitie die REP geeft.

In het hiernavolgende beschrijven we de metadataproperties steeds in tabellen, ingedeeld naar de volgende thema's:

  • Identificatie
  • Classificatie naar vorm, functie en inhoud
  • Naamgeving
  • Provenance
  • Manifestaties
  • Aggregatie

In de tabellen komt in de kolom Definitie de aanduiding REP voor. Dat geeft aan dat de definitie van de property — al dan niet in een enigszins gewijzigde of veralgemeniseerde vorm — overgenomen is uit REP. De kolom FRBR geeft een indicatie hoe de property zich tot het FRBR-model verhoudt (waarbij W staat voor werk, E voor expressie en M voor manifestatie). Zoals besproken in de voorgaande paragaaf zijn we in de TOOI-ontologie terughoudend met get gebruik van FRBR. De FRBR-aanduiding bij de properties is daarom indicatief en dient alleen als handreiking om begrippen te kunnen relateren aan andere relevante modellen waarin FRBR wel een rol speelt, zoals STOP en ECLI.

URIs en identificatie

Voor zover KOOP verantwoordelijk is voor de registratie van informatieobjecten zal KOOP een URI aan het informatieobject toekennen. Dat geldt ook voor documenten die door andere partijen aangeleverd worden. De door KOOP toegekende URI voldoet aan alle eisen om te kunnen fungeren als een persistent identifier (PID) conform de FAIR-principes.

Noot. We zeggen URI en niet URL, ondanks het feit dat we http-URIs bedoelen die normaliter dereferenceable zijn. Op dat laatste bestaan uitzonderingen. Een document kan rechtsgeldig vernietigd worden, waarna het dus niet meer opgehaald kan worden. We kunnen nog steeds naar het document verwijzen, als in "Het document <``https://plooi.overheid.nl/id12314``> is rechtsgeldig vernietigd op 21 juni 2083". In geval van vernietiging zullen we (waarschijnlijk) nog wel een metadatabundel in het PLOOI-register houden, zodat bijvoorbeeld de datum van vernietiging opgezocht kan worden. In deze metadatabundel gebruiken we de PID om naar het vernietigde document te verwijzen.

Het domein van de volgende properties is tooiont:Informatieobject:

Property Subject Object Card FRBR Definitie Toelichting
tooiont:pid tooiont:Informatieobject xsd:anyURI 1 WEMI De door KOOP toegekende persistente URI die het informatieobject denoteert

Binnen PLOOI wordt deze property als volgt toegepast. De URI die de waarde is van deze property wordt door PLOOI toegekend en wordt gebruikt in metadatabundels. Er kunnen andere URIs bestaan waarmee naar het document verwezen wordt.

Merk op dat dit een relatie is van informatieobjecten naar URIs, waarbij je dus uitspraken krijgt als {<uri-x> tooiont:pid <uri-x>}. Dit is analoog aan "Cindy heet 'Cindy'", met het tweede voorkomen van "Cindy" tussen aanhalingstekens.

dcterms:identifier tooiont:Informatieobject xsd:string of xsd:anyURI 0..n WEMI Een string of URI waarmee het informatieobject wordt aangeduid. Doorgaans wordt deze door de partij toegekend die het document aanlevert

Deze string of URI mag context-specifiek zijn en hoeft dus niet globaal uniek te zijn. Deze wordt niet gebruikt in PLOOI. Als een informatieobject  eenmaal een PLOOI-identifier (tooiont:pid) toegewezen heeft gekregen, dan is dat de officiële en eenduidige URI voor dat document.

De DCMI-definitie luidt: Een ondubbelzinnige verwijzing naar de resource binnen een gegeven context. Zie hier.

Nota bene: de definitie in DCMI specificeert rdf:Literal als bereik, wij nemen hier een subset van

Properties voor classificatie naar vorm, functie en inhoud

De properties in deze paragraaf worden gebruikt om informatieobjecten te beschrijven en in te delen naar vorm, functie en inhoud. Veel van deze properties hebben een skos:Concept als waarde.

Noot: In OWMS 4.0 hebben classificatie-properties niet een concept maar een klasse als waarde (bijvoorbeeld subklassen van Documenttype). De keuze voor concepten gaat ervan uit dat metadatabeheerders de thesaurus eenvoudig kunnen aanpassen, terwijl een ontologiewijziging meer voeten in de aarde heeft.

Om aan te geven wat de taal is van een informatieobject gebruiken we de algemeen bekende dcterms-properties. Voor de waarden gebruiken we voor zover mogelijk de daarvoor gemunte concepten zoals deze gedefinieerd zijn in de AT-tabellen van de Europese Commissie, met een enkele uitzondering. Zie 3.3 - TOOI-Xtrn. Hetzelfde geldt ook voor het format van een informatieobject, zie paragraaf Properties voor manifestaties (bestanden).

Voor het beschrijven van informatieobjecten op (uitsluitend) inhoudelijke gronden kent TOOI de noties thema, onderwerp en trefwoord. Thema's zijn voorgedefinieerd en hebben de vorm van een concept. Trefwoorden zijn strings en kunnen vrij gekozen worden. Een onderwerp is een korte omschrijving die het doel heeft om bij het presenteren van grotere hoeveelheden informatieobjecten duidelijk aan te kunnen geven waar elk informatieobject in hoofdlijnen over gaat. Het onderwerp is dus meer een beschrijving dan een indelingscriterium, maar er is potentieel enige overlap met trefwoord. De doelstellingen zoals gedefinieerd in onderstaande tabel geven aan welke notie van toepassing is.

Property Subject Object Conceptschema Card FRBR Definitie Toelichting
tooiont:documentsoort tooiont:Informatieobject skos:Concept tooikern: overheids informatie 0..n W Het soort document waar het informatieobject toe behoort

Er is behoefte aan een fijnmazige maar eenvoudig toe te passen categorisering die voor veel doeleinden kan worden gebruikt. Documentsoort voorziet in die behoefte. Daarom is de indeling in termen van het toegepaste categorisatiecriterium niet volledig consistent. Documentsoort kan bepaald zijn naar functie binnen een proces (bezwaarschrift, adviesdocument), naar de aard van de opsteller (document van burger, rechterlijk document), naar de aard van de gebruiker van het document (parlementair document), naar de manier van publicatie (gemeenteblad, staatscourant) — enzovoorts. Het scheiden van de verschillende indelingscriteria in verschillende properties levert te veel complexiteit op in het redactionele proces.

Door de diversiteit in documentsoorten varieert het gebruik van dit metadata-element sterk. Omdat we de mogelijke gebruikscontext van concepten binnen TOOI zoveel mogelijk buiten beschouwing laten maken we voor specifieke afnemers doorsneden van het conceptschema (in de vorm van een skos:Collection), waarbij de concepten desgewenst afnemer-specifieke labels kunnen krijgen en in een afnemerspecifieke hiërachie uitgeleverd kunnen worden.

tooiont:onderwerp tooiont:Informatieobject xsd:string
0..n W Een tekstuele beschrijving in één of enkele woorden van datgene waar het informatieobject over gaat Het doel van deze property is om bij het presenteren van grotere hoeveelheden informatieobjecten duidelijk en overzichtelijk aan te kunnen geven waar elk informatieobject in hoofdlijnen over gaat. De beschrijving van het onderwerp is specifiek en dus, in principe, voor elk informatieobject anders. Het gaat dus nadrukkelijk niet om een waarde uit een gesloten begrippenlijst (concept). Voor dat doel kan de property tooiont:thema worden gebruikt.
tooiont:thema tooiont:Informatieobject skos:Concept
0..n W Het thema waaronder het informatieobject valt, uit een voorgedefinieerde verzameling thema's Het doel van deze property is om informatieobjecten in te delen volgens een voorgedefinieerd classificatieschema. De concepten in het bereik kunnen uit verschillende conceptschema's komen. Dit zal per documentcollectie verschillen. Voor instanties van de subklasse officiële publicatie is de waarde beperkt tot thema's in de TOP-thesaurus: zie aldaar. De REP spreekt over het onderwerp. Het is duidelijk dat het hier, in de terminologie die TOOI hanteert, om een thematische aanduiding gaat waarbij de waarde van de property een concept is. We houden hier vast aan de terminologie van Thema-indeling Overheidspublicaties (TOP) en gebruiken de termen thema (tooiont:thema) en onderwerp (tooiont:onderwerp) overeenkomstig. (REP, onderwerp)
tooiont:trefwoord tooiont:Informatieobject xsd:string
0..n W Een term die kan fungeren als criterium voor groeperen van informatieobjecten, of als zoekterm voor indexeren Het doel van deze property is om informatieobjecten met maximale flexibiliteit in te delen volgens een vrij, informeel en onbeheerd classificatieschema. 
tooiont:omschrijving tooiont:Informatieobject xsd:string
0..n W Een tekstuele beschrijving in enkele zinnen van het onderwerp van het informatieobject Het doel van deze property is om bij het presenteren van een beperkte selectie van informatieobjecten in meer detail aan te kunnen geven waar elk informatieobject over gaat, in de vorm van een samenvatting
dcterms:language tooiont:Informatieobject skos:Concept tooixtrn:taal 0..n W,E De taal waarin het informatieobject is gepubliceerd (REP, taal) De waarde van deze property is een concept uit het schema tooixtrn:taal

Properties voor naamgeving

We onderscheiden een aantal varianten van het begrip "titel". In principe is de titel een eigenschap van een werk. Expressies van een werk kunnen echter een afwijkende titel hebben (Die Dunkelkammer des Damokles is — onder een bepaalde interpretatie van FRBR — de titel van een expressie van De donkere kamer van Damokles).

Elke titelproperty in de tooiont-namespace is gedefinieerd als een subproperty van dcterms:title.

Property Subject Object Card FRBR Omschrijving owl:subPropertyOf
tooiont:titel tooiont:Informatieobject xsd:string 0..n W, E De titel van het informatieobject dcterms:title
tooiont:officieleTitel tooiont:Informatieobject xsd:string 1 W, E De officiële titel van het informatieobject (REP, officiële titel) dcterms:title
tooiont:verkorteTitel tooiont:Informatieobject xsd:string 0..n W, E De verkorte titel van het informatieobject dcterms:title
tooiont:citeertitel tooiont:Informatieobject xsd:string 0..n W, E De citeertitel is de wijze waarop een informatieobject, blijkens een bepaling in dat informatieobject zelf, wordt aangeduid (REP, citeertitel) dcterms:title
tooiont:alternatieveTitel tooiont:Informatieobject xsd:string 0..n W, E De alternatieve titel van het informatieobject dcterms:title
 tooiont:afkorting tooiont:Informatieobject xsd:string 0..n W, E  De afkorting van de titel van het informatieobject

Properties voor provenance

Provenance-metadata van een informatieobject zeggen iets over de processen die van invloed zijn geweest de levensloop ervan, zoals totstandkoming, publicatie en aanpassing. Wie was bij het proces betrokken, op welk moment gebeurde er iets, enzovoorts. De aard van de gebeurtenissen die de levensloop van een informatieobject bepalen varieert sterk en hangt af van de aard van het object zelf. Een rechterlijke uitspraak bestaat formeel vanaf het moment dat de rechter deze uitspreekt. Een wetswijziging bestaat officieel vanaf het moment dat deze officieel bekend wordt gemaakt, en is van kracht vanaf het moment dat deze in werking treedt. Het is onmogelijk om voor alle soorten informatieobjecten binnen de overheid gedetailleerde levensloopinformatie in generieke, uniforme termen vast te leggen. We munten daarom een beperkt aantal generieke eigenschappen. Ook zijn we terughoudend met het gebruik van prov:generated, prov:invalidated en prov:used: de interpretatie van deze properties zal per type document sterk verschillen. Voor een wetswijziging is de waarde van prov:generated gelijk zijn aan de publicatiedatum, maar voor een rapport dat in de Tweede Kamer behandeld is zal de interpretatie anders zijn.

Property Subject Object Card FRBR Definitie Toelichting
tooiont:verantwoordelijke tooiont:Informatieobject tooiont:Overheidsorganisatie 0..1 W, E Overheidsorganisatie die de wettelijke verantwoordelijkheid draagt voor de inhoud (strekking) van het informatieobject.  (REP, verantwoordelijke)
tooiont:soortBesluitendOrgaan tooiont:Informatieobject skos:Concept 0..1 W, E Het soort orgaan dat verantwoordelijk is voor het besluit dat de strekking is van het informatieobject (indien van toepassing). De waarde van deze property is een concept uit het schema tooikern:bestuursorgaan.
Voorbeelden zijn B&W en de gemeenteraad. (REP, vastgesteld door)
tooiont:publicatiedatum tooiont:Informatieobject xsd:date OF xsd:gYearMonth OF xsd:gYear 0..n E De datum van publicatie. (REP, publicatiedatum)
dcterms:publisher tooiont:Informatieobject tooiont:Overheidsorganisatie 0..1 WEMI De entiteit die verantwoordelijk is voor het publiceren van het informatieobject, meer in het bijzonder de partij die de plicht heeft tot actieve openbaarmaking ervan Het gaat hier dus om de organisatie die verantwoordelijk is voor het publiceren. BZK (waar KOOP een afdeling van is) verzorgt voor veel publicaties de technische aspecten van het publiceren, maar doet dit vaak namens andere partijen. De gemeente die een officiële bekendmaking ter publicatie aan KOOP aanbiedt is de dcterms:publisher en ook de tooiont:verantwoordelijke. Deze twee properties kunnen ook verschillende waarden hebben, bijvoorbeeld als een gemeente een dossier publiceert met daarin een brief van de minister. In dat geval is de gemeente de dcterms:publisher terwijl de minister de tooiont:verantwoordelijke is. Beide properties zijn optioneel.
dcterms:creator tooiont:Informatieobject xsd:string 0..1 WEMI Actor die de eindverantwoordelijkheid draagt voor het creëren van het informatieobject.

De maker wordt vastgelegd als string omdat er geen eis gesteld wordt aan het type van de maker.

Er is geen algemene regel te geven voor welke entiteit als maker van een informatieobject beschouwd moet worden. Dit kan per collectie vastgesteld worden. Een vuistregel is dat als de verantwoordelijke voor de inhoud (tooiont:verantwoordelijke) en de maker dezelfde organisatie is, alleen de verantwoordelijke wordt vastgelegd.

Voorbeelden

  • Een gemeente publiceert een bouwvergunningsaanvraag, die is ingediend door een particulier. De gemeente is de verantwoordelijke; de particulier is de maker. Besloten wordt om alleen de verantwoordelijke vast te leggen.
  • Een ministerie geeft een adviesbureau of universiteit opdracht een onderzoek uit te voeren en daarvan een rapport op te stellen. Het ministerie is de eindverantwoordelijke van het rapport en het bureau of universiteit de maker. Besloten wordt om zowel verantwoordelijke als maker apart vast te leggen.
  • Een kenniscentrum publiceert op haar website documenten die door gemeenten zijn opgesteld. De gemeente is verantwoordelijke en maker van de documenten; besloten wordt om de gemeente alleen als verantwoordelijke vast te leggen.
dcterms:created tooiont:Informatieobject xsd:date OF xsd:gYearMonth OF xsd:gYear 0..1 WEMI Datum waarop het informatieobject gemaakt is. Er is geen algemene regel te geven voor welke datum als creatiedatum van een informatieobject beschouwd moet worden. Voor overheidsdocumenten geldt dat de creatiedatum doorgaans niet vermeld wordt (wel: datum ter inzage gelegd, datum ondertekening, datum van ingang, datum geldig, enzovoorts). Voor rapporten geproduceerd door niet-overheidsorganisaties wordt de creatiedatum wel bijna altijd vermeld.
prov:generatedAtTime
tooiont:Informatieobject xsd:dateTime 0..1 E Het tijdstip waarop het informatieobject is gegenereerd, waarna het bestaat.  Als dcterms:created gespecificeerd is en prov:generatedAtTime ook, dan moet het datumgedeelte van de laatstgenoemde waarde gelijk zijn aan de creatiedatum.
tooiont:heeftGrondslag tooiont:Informatieobject xsd:anyURI 0..n W De grondslag voor het besluit dat de strekking is van het informatieobject. De waarde van deze property is een URI die een rechtsgrond identificeert. Deze voldoet aan een van de in deze context gangbare URI-standaarden, zoals JuriConnect en ECLI.
tooiont:heeftGrondslagString tooiont:Informatieobject xsd:string 0..n W De grondslag voor het besluit dat de strekking is van het informatieobject, in de vorm van een string. De waarde van deze property is een string die voldoet aan de gangbare conventies om een rechtsgrond aan te duiden. Het gebruik van deze property dient beperkt te blijven tot gevallen waarin het gebruik van een URI niet mogelijk is.

Properties voor manifestaties (bestanden)

Het kan nodig zijn een document in meerdere formats beschikbaar te maken, bijvoorbeeld XML en PDF. Er is dan sprake van drie informatieobjecten: het meer algemene informatieobject, en de twee meer specifieke vormen van dat informatieobject, elk in een eigen format. In de FRBR-terminologie worden deze laatste twee informatieobjecten aangeduid als manifestaties, ook wel genoemd bestanden. TOOI definieert geen aparte subklassen van tooiont:Informatieobject om onderscheid te kunnen maken tussen de diverse FRBR-begrippen. In de paragraaf Versies en manifestaties gaan we nader in op de modellering van deze informatieobjecten en hun relaties, ook in relatie tot FRBR. In deze paragraaf bespreken we de properties die specifiek zijn voor 'manifestaties'. 

Property Subject Object Conceptschema Card FRBR Definitie Toelichting
dcterms:format tooiont:Informatieobject skos:Concept tooixtrn:file-type 0..1 M Het format (bijvoorbeeld XML, PDF, CSV) waarin het informatieobject zich manifesteert. De waarde van deze property is een concept uit het schema tooixtrn:file-type
tooiont:heeftRealisatie tooiont:Informatieobject xsd:anyURI
0..1 M Een realisatie van het informatieobject in de vorm van een fysiek bestand Telkens als de URL die de waarde is van deze property wordt meegegeven in een http-request wordt er een realisatie geretourneerd. Met 'realisatie' wordt hetzelfde bedoeld als het FRBR-begrip 'Item'. Het is een fysiek exemplaar van het beschreven informatieobject (een manifestatie)

Properties voor aggregatie

Een informatieobject kan deel uitmaken van een aggregatie, dat wil zeggen een verzameling informatieobjecten, zoals een dossier of een collectie. TOOI biedt drie manieren waarop dat kan worden vastgelegd.

Aggregatiekenmerk

De eerste manier om aggregatie vast te leggen is door een waarde te specificeren voor de property tooiont:aggregatiekenmerk. Als verschillende informatieobjecten dezelfde waarde voor deze property hebben, dan worden deze beschouwd als een documentaggregatie. Applicaties kunnen dit dan gebruiken om documenten als groep te presenteren. Het is in principe aan de metadaterende partij om te zorgen dat de aangeleverde aggregatiekenmerken "globally unique" zijn. Een kenmerk als "2021-135" wordt daarom afgeraden. Binnen de context van een applicatie of collectie kunnen met betrekking tot de toegestane waarden nadere afspraken gemaakt worden. TOOI stelt hier modelmatig gezien geen eisen aan. De aggregatie als zodanig (een dossier, een zaak of een andere verzameling) wordt hierbij niet gemodelleerd en krijgt dan ook geen URI. Er kan alleen indirect naar verwezen worden. Het volgende plaatje illustreert dit: de informatieobjecten A en B delen een aggregatiekenmerk en horen dus bij een aggregatie, maar deze is in TOOI-termen niet zichtbaar, zoals de stippellijn aangeeft.

Gecomprimeerd bestand

De tweede manier om vast te leggen dat er sprake is van documentaggregatie is van toepassing wanneer een informatieobject een gecomprimeerd bestand is, dat bijvoorbeeld een Wob-dossier representeert. De aanleverende partij kan er voor kiezen om het dossier en de dossierstukken apart aan te leveren en te metadateren — dat is de derde optie die verderop wordt beschreven. Bij deze tweede optie levert de aanleverende partij simpelweg een gecomprimeerd bestand aan. Het is noodzakelijk om aan te geven wat het bestandstype is door middel van dcterms:format. Een eindgebruiker kan het gecomprimeerde bestand uitpakken en de resulterende bestanden inzien en gebruiken, maar deze zijn in dit patroon verder niet gemetadateerd. Het volgende plaatje illustreert dit: de informatieobjecten A en B maken deel uit van het gecomprimeerde bestand C, maar deze zijn niet beschreven in termen van TOOI-metadata, evenmin als de relatie "maakt deel uit van" — vandaar de stippellijnen.

De aggregatierelatie

De derde optie om aggregatie vast te leggen is door de relatie tussen een informatieobject en de aggregatie waar deze bijhoort expliciet te maken. De klasse tooiont:SamengesteldInformatieobject is gedefinieerd als de subklasse van tooiont:Informatieobject waarvoor geldt dat het informatieobject nul of meerdere informatieobjecten bevat. De relatie waar het daarbij om gaat is dcterms:isPartOf. Ontologische gezien kunnen diverse part-of-relaties worden onderscheiden. TOOI beperkt het gebruik van dcterms:isPartOf om een relatie aan te duiden met de volgende karakteristieken:

  • De relatie is transitief. Als een document deel uitmaakt van de documentlevering, en de documentlevering maakt samen met de aanvraag en de beschikking deel uit van een WOB-dossier, dan maakt het document ook deel uit van het WOB-dossier. (Dit is niet geformaliseerd in de zin van owl:TransitiveProperty, maar mag wel afgeleid worden als dcterms:isPartOf gebruikt wordt bij het beschrijven van instanties van tooiont:Informatieobject.)
  • De relatie van het deel met het geheel is niet exclusief. Een document kan deel uit maken van meerdere WOB-dossiers
  • De relatie is contingent, dat wil zeggen dat de identiteit van de delen en de identiteit van het geheel onafhankelijk van elkaar zijn

TOOI beperkt het bereik van dcterms:isPartOf tot tooiont:SamengesteldInformatieobject. Een instantie van tooiont:SamengesteldInformatieobject kan uiteraard alle properties hebben die gedefinieerd zijn voor tooiont:Informatieobject. Ook een samengesteld informatieobject kan een een realisatie in de vorm van een bestand hebben (tooiont:heeftRealisatie); in dat geval dient een waarde voor dcterms:format gespecificeerd te zijn die staat voor een gecomprimeerde bestandsvorm, zoals file-type:ZIP. Een samengesteld informatieobject heeft optioneel een waarde voor tooiont:soortSamengesteldInformatieobject. Dit is een concept uit het conceptschema tooikern:SoortSamengesteldInformatieobject. Het volgende schema (met labels in plaats van URIs) illustreert dit:

Noot. De property dcterms:isPartOf wordt ook wel opgevat als een compositie- in plaats van aggregatierelatie. Binnen TOOI geldt dat deze noties niet in formele zin gebruikt worden omdat ze ontologisch gezien onvoldoende helder zijn. PROV-O kent de property prov:hasMember, met als domein prov:Collection. PROV-O definieert deze property als volgt: "A collection is an entity that provides a structure to some constituents, which are themselves entities. These constituents are said to be member of the collections." In het document dat de mapping van DCMI naar PROV beschrijft wordt de DCMI property van mapping uitgesloten ("Since entity composition is out of the scope of PROV, this property has been excluded from the mapping"). De DCMI- en PROV-O-properties kunnen dus zonder bezwaar naast elkaar gebruikt worden. In het voorbeeld dat PROV-O gebruikt (leden van het Amerikaanse Supreme Court) blijkt dat het hier gaat om een niet-transitieve part-of-relatie.

Voorbeeld: een WOB-Dossier

Het volgende schema illustreert de drie opties om aggregatie te beschrijven met het TOOI-vocabulaire. Dit aan de hand van een dossier getiteld "WOB-Dossier X" dat drie informatieobjecten bevat: een aanvraag, een beschikking, en de bestandslevering — een gecomprimeerd bestand met daarin de vrijgegeven bestanden. Stippellijntjes geven aan dat het betreffende element (object of relatie) niet expliciet uitgedrukt kan worden met het TOOI-vocabulaire. Samengestelde informatieobjecten zijn oranje, andere informatieobjecten zijn grijs.

De Bestandslevering in Optie 3 kan, inclusief de bestanden die het bevat, desgewenst ook weer beschreven worden als een samengesteld informatieobject met de (al dan niet enkelvoudige) informatieobjecten die er deel van uitmaken. De relatie is immers recursief gedefinieerd.

Voorbeeld: een brief met bijlagen

Ook een brief met bijlagen kan gezien worden als een aggregatie. TOOI kent geen specifieke property om de relatie is-bijlage-bij uit te drukken. Het volgende schema laat zien hoe deze situatie beschreven kan worden met het TOOI-vocabulaire voor aggregatie.

De resource aangeduid als "Brief-met-bijlagen" is een samengesteld informatieobject en heeft eigenstandige metadata. Deze zullen in het normale geval een deelverzameling zijn van de metadata van de resource aangeduid als "Brief". Te denken valt aan een geval waarin voor de "Brief" aangegeven wordt dat het een PDF-document is (met behulp van de property dcterms:format en het concept file-type:PDF) terwijl de "Brief-met-bijlagen" geen formatspecificatie heeft. Er zijn uiteraard alternatieve manieren om een brief met bijlagen vorm te geven. Een bijlage kan bijvoorbeeld simpelweg opgenomen zijn als tekst in de brief: dan is deze als zodanig in TOOI-termen niet te beschrijven. Het gebruik van het aggregatiebegrip maakt een gedetailleerde metadatering mogelijk.

Klassen en properties

Klasse Subklasse van Definitie
tooiont:SamengesteldInformatieobject tooiont:Informatieobject Een informatieobject dat andere informatieobjecten bevat
Property Subject Object Card FRBR Definitie Toelichting
tooiont:aggregatiekenmerk tooiont:Informatieobject xsd:string 0..n WEMI Het kenmerk op basis waarvan verschillende informatieobjecten gemarkeerd zijn als horende bij een dossier, zaak of andersoortige aggregatie
tooiont:soortSamengesteldInformatieobject tooiont:SamengesteldInformatieobject skos:Concept 0..1 WEMI De soort aggregatie, zoals aangeduid door het concept De concepten zijn gedefinieerd in het conceptschema tooikern:SoortSamengesteldInformatieobject
dcterms:isPartOf tooiont:Informatieobject tooiont:SamengesteldInformatieobject

[0..n]-

[0..m]

WEMI Een gerelateerd informatieobject dat geïncludeerd is in het beschreven samengestelde informatieobject

DOCUMENTHANDELING

Voor het uitdrukken van levensloopgebeurtenissen die betrekking hebben op een document definiëren we de klasse tooiont:Documenthandeling als een subklasse van prov:Activity. Het gaat om een handeling die een bestaand informatieobject van toestand doet veranderen (het document is ter inzage gelegd), dan wel een nieuw informatieobject doet ontstaan (het document is gewijzigd en er ontstaat een nieuwe (geconsolideerde) versie van het document). In de ontologie van organisatiewijzigingen hebben we een onderscheid aangebracht tussen toestandswijzigingen en existentiële wijzigingen. Op dit moment lijkt er in het geval van informatieobjecten weinig aanleiding om dat hier ook te doen. TOOI definieert daarom de volgende klasse, zonder subklassen:

Klasse Subklasse van Definitie Toelichting
tooiont:Documenthandeling prov:Activity Een handeling die een bestaand informatieobject van toestand doet veranderen, dan wel een nieuw informatieobject doet ontstaan Voorbeeld van een toestandswijziging: het document is ter inzage gelegd. Voorbeeld van een nieuw informatieobject doen ontstaan: het document is gewijzigd en er ontstaat een nieuwe versie van het document

We maken gebruik van de generieke properties van PROV-O om de relatie te leggen tussen instanties van deze klasse en informatieobjecten. Voor wat betreft de relatie tussen handeling en partijen (organisaties) geldt dat we deze nog niet meenemen. Dat komt in een volgende release.

Een instantie van tooiont:Documenthandeling kan de volgende properties hebben:

Property Subject Object Card Definitie
prov:used tooiont:Documenthandeling tooiont:Informatieobject 1..n Het informatieobject of de informatieobjecten waar de handeling op uitgevoerd wordt
dcterms:date tooiont:Documenthandeling xsd:date OF xsd:gMonthYear OF xsd:gYear

De datum waarop handeling plaatsvond
prov:atTime xsd:dateTime xsd:dateTime
Het tijdstip van handeling. Wanneer zowel dcterms:date als prov:atTime zijn gespecificeerd, dan moet het datumgedeelte in de een overeenkomen met de ander
prov:wasAssociatedWith tooiont:Documenthandeling tooiont:Overheidsorganisatie
De entiteit die de handeling heeft uitgevoerd of namens wie de handeling is uitgevoerd
tooiont:soortHandeling tooiont:Documenthandeling skos:Concept 1 De soort handeling. In het bereik zijn concepten uit het conceptschema tooikern:soortHandeling.

SUBKLASSEN VAN INFORMATIEOBJECT EN HUN SPECIFIEKE PROPERTIES

Zoals in de inleiding genoemd onderscheiden we de volgende subklassen van tooiont:Informatieobject:

  • Officiële publicatie
  • Waardelijst

In de eerste release van de TOOI-ontologie zijn alleen de officiële bekendmakingen en de waardelijsten daadwerkelijk als subklasse gedefinieerd. In een toekomstige versie komen daar geconsolideerde regelingen, rechterlijke documenten, parlementaire documenten en mogelijk nog andere subklassen bij.In het hiernavolgende bespreken we de twee genoemde subklassen en hun specifieke properties.

Officiële publicatie

Met de term "officiële publicaties" bedoelen we documenten waarvan wettelijk is bepaald dat deze moeten worden gepubliceerd in een van de publicatiebladen. Het kan onder meer gaan om wetten, gemeentelijke verordeningen, publicaties omtrent aangevraagde of verstrekte vergunningen of om mededelingen omtrent faillissementen. Bepalingen omtrent welke documenten in een publicatieblad moeten worden bekendgemaakt zijn opgenomen in tal van wetten.

De properties die horen bij instanties van tooiont:OfficielePublicatie:

Property Subject Object Card FRBR Definitie Toelichting
tooiont:rubriek tooiont:OfficielePublicatie skos:Concept 0..n W De soort publicatie, bijvoorbeeld algemeen verbindend voorschrift of beleidsregel. Dit veld bepaalt (onder meer) de rubrieksindeling op https://www.officielebekendmakingen.nl." (REP, informatietype)

Het bereik is beperkt tot concepten in het conceptschema tooiwep:rubriek

Noot: In OWMS 4.0 heette het begrip rubriek nog "informatietype". De naam "rubriek" drukt de betekenis van de property beter uit.

tooiont:datumInwerkingtreding tooiont:OfficielePublicatie xsd:date 0..1 E De datum waarop het besluit of de regeling vervat in het informatieobject in werking treedt. Let op: niet de datum tot en met wanneer het besluit of de regeling eventueel terugwerkt (REP, datum inwerkingtreding)
tooiont:datumTerugwerkendeKracht tooiont:OfficielePublicatie xsd:date 0..1 E De in het informatieobject eventueel genoemde vóór de inwerkingtreding gelegen datum vanaf wanneer het besluit of de regeling vervat in het informatieobject van toepassing is. (REP, datum terugwerkende kracht)
tooiont:datumUitwerkingtreding tooiont:OfficielePublicatie xsd:date 0..1 E De datum vanaf wanneer het besluit of de regeling vervat in het informatieobject is ingetrokken of vervallen, dan wel een versie van het informatieobject door een nieuwe versie is vervangen. (REP, datum uitwerkingtreding)
tooiont:publicatieblad tooiont:OfficielePublicatie skos:Concept 0..1 W Het blad, gerepresenteerd door een concept uit het conceptschema tooikern:publicatieblad. Zie toelichting verderop. In de metadata op officielebekendmakingen.nl heet deze "overheidop.publicationName". In STOP is dit data:publicatieblad.
tooiont:publicatiejaargang tooiont:OfficielePublicatie xsd:gYear 0..1 W De jaargang van het blad In de metadata op officielebekendmakingen.nl heet deze "overheidop.jaargang". In STOP is dit data:jaargang
tooiont:publicatienummer tooiont:OfficielePublicatie xsd:integer 0..1 W Het volgnummer binnen de jaargang van het blad In de metadata op officielebekendmakingen.nl heet deze "overheidop.publicationIssue". In STOP is dit data:publicatienummer
tooiont:opCode tooiont:OfficielePublicatie xsd:string 0..1 W

De code waarmee volgens de gangbare coderingssystematiek een officiële publicatie uniek wordt aangeduid. Deze bestaat uit de afkorting voor het publicatieblad, de jaargang en het volgnummer, gescheiden door '-'. Bijvoorbeeld "gmb-2020-25"

Nota bene: REP heeft daarnaast "Bij elektronische bekendmaking wordt ook een URL opgenomen." In de huidige context fungeert de URI van de bekendmaking tevens als URL.

In de metadata op officielebekendmakingen.nl heet deze "overheidop.publicationIdentifier". In STOP is dit data:publicatieIdentifier

De acht publicatiebladen worden in de TOOI-kernthesaurus als volgt weergegeven:

In een wat verder verleden bestonden alleen Staatsblad, Staatscourant en Tractatenblad als zodanig. Wettelijk was bepaald dat veel documenten (vooral van lagere overheden en rechtbanken) moesten worden gepubliceerd in landelijke of plaatselijke dagbladen. In de loop der jaren is dit geleidelijk opgeschoven naar elektronische publicatie in een specifiek publicatieblad. Sinds de inwerkingtreding van de Wet elektronische bekendmaking op 11 juni 2009 zijn Staatsblad en Staatscourant nog slechts in de elektronische versie authentiek. In de loop der jaren heeft dit proces zich ook voor andere publicaties voltrokken, vooralsnog met uitzondering van het Afkondigingsblad.

De bladen zelf bestaan eigenlijk alleen nog als kenmerk van de documenten die "in" elk van de bladen worden gepubliceerd. Elk document wordt uniek aangeduid door het publicatieblad, de jaargang, en een volgnummer. Het volgnummer begint elk jaar weer opnieuw. Een hoger volgnummer betekent meestal een latere publicatiedatum, maar dat hoeft niet altijd. Op basis van deze unieke code wordt de URI van het stuk opgebouwd. Het stuk kent manifestaties in de vorm van PDF, HTML, ODT en XML.

Elk van de bladen wordt in het kennismodel gerepresenteerd als een instantie van skos:Concept in het conceptschema tooikern:publicatieblad. Het skos:prefLabel staat voor de volledige naam, het skos:altLabel voor de officiële afkorting.

De volgende tabel toont een overzicht van bladen, afkorting, en URIs

URI prefLabel altLabel Voorbeeld URI van bekendmaking Omschrijving
tooikern:c_852da199 Afkondigingsblad AB nvt Het blad waarin bekendmakingen worden gepubliceerd van Caribische Openbare Lichamen. Dit blad gaat thans nog niet mee in de digitale systematiek van de overige bladen
tooikern:c_12cd7b9b Blad gemeenschappelijke regeling Bgr https://officielebekendmakingen.nl/bgr-2020-424 Het blad waarin bekendmakingen worden gepubliceerd van organisaties die gevormd zijn op basis van een gemeenschappelijke regeling
tooikern:c_81cc2eb5 Gemeenteblad Gmb https://officielebekendmakingen.nl/gmb-2020-25 Het blad waarin bekendmakingen worden gepubliceerd van gemeenten
tooikern:c_bdc265d5 Provinciaal blad Prb https://officielebekendmakingen.nl/prb-2020-2507 Het blad waarin bekendmakingen worden gepubliceerd van provincies
tooikern:c_61e3099a Staatsblad Stb https://officielebekendmakingen.nl/stb-2020-119 Het Staatsblad van het Koninkrijk der Nederlanden is een blad waarlangs de Nederlandse regering wetten (in formele zin), algemene maatregelen van bestuur en andere koninklijke besluiten waarbij algemeen verbindende voorschriften worden vastgesteld, bekendmaakt
tooikern:c_0670bae1 Staatscourant Stcrt https://officielebekendmakingen.nl/stcrt-2020-9 De Nederlandse Staatscourant is een digitale uitgave van de Nederlandse regering waarin, onder meer, algemeen verbindende voorschriften worden gepubliceerd die bij ministeriële regeling zijn vastgesteld, of vanwege het Rijk zijn vastgesteld maar niet in het Staatsblad gepubliceerd worden.
tooikern:c_b3179555 Tractatenblad Trb https://officielebekendmakingen.nl/trb-2020-4 Het Tractatenblad van het Koninkrijk der Nederlanden bestaat sinds 1951 en bevat de tekst van en de gegevens over verdragen die het Koninkrijk der Nederlanden met andere staten of volkenrechtelijke organisaties heeft gesloten, alsmede daaraan gerelateerde besluiten.
tooikern:c_c97b118a Waterschapsblad Wsb https://officielebekendmakingen.nl/wsb-2020-3 Het blad waarin bekendmakingen worden gepubliceerd van waterschappen

Waardelijsten

Een waardelijst is een (semi-) gestructureerde selectie van informatie in het kennismodel die een applicatiespecifiek doel dient. Het is een instantie van tooiwl:Waardelijst. Een waardelijst wordt gegenereerd uit één of meerdere grafen, namelijk registers en thesauri. Zie 2.4 - De Waardelijstontologie voor verdere toelichting.