MDTO-specificaties
Inleiding
In de toekomst zal het mogelijk worden om metadata volgens de MDTO-specificatie in de sitemaps aan te leveren. Een concept-specificatie daarvan is alvast opgenomen op deze pagina om een indruk te geven van de werking. Het is nog niet besloten wanneer MDTO-aanleveringen door de woo-harvester verwerkt kunnen gaan worden. Ook kunnen de specificaties op deze pagina nog worden aangepast naar aanleiding van commentaar en/of eigen bevindingen. Er kunnen dus geen rechten ontleend worden aan de inhoud van deze pagina.
Status
Deze uitwerking heeft de status van een aanbeveling. Net als de andere aanbevelingen in deze handleiding gaat het hier om niet-blokkerende specificaties. Als een bestuursorgaan de aanbeveling volgt, dan zal de Woo-harvester de metadata goed en betekenisvol kunnen verwerken. Als de aanbeveling niet gevolgd wordt, dan zal de Woo-harvester nog steeds het document full-text verwerken en waar mogelijk op basis van "best effort" metadata doorzoekbaar maken. Deze documenten zullen dan minder goed vindbaar zijn voor eindgebruikers.
Relatie tussen MDTO en TOOI
In de documentmetadata kan gekozen worden voor de TOOI-modellering, zoals beschreven
op pagina Aanbevelingen voor metadata, of de MDTO-modellering, zoals beschreven op deze pagina.
Een 'gemengde' invulling wordt niet ondersteund.
Dit is vastgelegd middels een keuze (xs:choice
) in het XSD-element diwoo:Document.
Daarnaast kunnen,in aanvulling op de metadata volgens TOOI of MDTO, er eigen metadata
aangeboden worden als naam/waarde-paren binnen element diwoo:extraMetadata.
(..)
xmlns:diwoo="https://standaarden.overheid.nl/diwoo/metadata/"
xmlns:mdto="https://www.nationaalarchief.nl/mdto"
(..)
<xs:element name="Document" type="diwoo:DocumentType"/>
<xs:complexType name="DocumentType">
<xs:sequence>
<xs:choice minOccurs="1" maxOccurs="1">
<xs:element name="DiWoo" minOccurs="0" maxOccurs="1" type="diwoo:DiWooType">
<xs:annotation>
<xs:documentation>container-element voor de metadata van een document volgens DIWOO</xs:documentation>
</xs:annotation>
</xs:element>
<xs:element ref="mdto:MDTO" minOccurs="1" maxOccurs="unbounded">
<xs:annotation>
<xs:documentation>container-element voor de metadata van een document volgens MDTO</xs:documentation>
</xs:annotation>
</xs:element>
</xs:choice>
<xs:element name="extraMetadata" minOccurs="0" maxOccurs="unbounded"
type="diwoo:extraMetadataType"/>
</xs:sequence>
</xs:complexType>
(..)
Voor een aantal velden uit de TOOI-standaard is binnen de context van de Woo-harvester
een MDTO-tegenhanger aan te wijzen.
Dit kan in gevallen een MDTO-eigenschap zijn; bijvoorbeeld onder bepaalde voorwaarden
kan mdto:archiefvormer
gebruikt worden om een diwoo:publisher te coderen.
Bij bepaalde eigenschappen en begrippen is er geen eenduidige instructie binnen MDTO beschikbaar. Voor deze eigenschappen en begrippen is binnen deze aanbeveling gekozen om dit via verwijzingen naar TOOI-identifiers op te schrijven, binnen de meest passende constructies van MDTO.
Een voorbeeld hiervan is de aanbeveling om het veld `diwoo:thema` te gebruiken.
Binnen MDTO is een mdto:classificatie
een passende keuze.
De verwijzingen naar het begrip en de begrippenlijst gaat dan middels de TOOI-identifiers.
Het begripLabel en verwijzingNaam dienen hier voor de mensleesbaarheid van de sitemap.
Voor de betekenisvolle verwerking gaat de Woo-harvester uit van de TOOI-identifiers,
zoals opgenomen in de begripCode.
<classificatie>
<begripLabel>cultuur en recreatie</begripLabel>
<begripCode>https://identifier.overheid.nl/tooi/def/thes/top/c_0361ffb3</begripCode>
<begripBegrippenlijst>
<verwijzingNaam>Thema-indeling voor Officiële Publicaties (TOP-lijst)</verwijzingNaam>
<verwijzingIdentificatie>
<identificatieKenmerk>
https://identifier.overheid.nl/tooi/set/scw_toplijst/1
</identificatieKenmerk>
<identificatieBron>
https://standaarden.overheid.nl/tooi
</identificatieBron>
</verwijzingIdentificatie>
</begripBegrippenlijst>
</classificatie>
MDTO-schema
Met de XML-schema van MDTO kan gevalideerd worden of sitemaps, die gebruik maken van MDTO-metadata, consistent zijn met deze specificatie, en daarmee probleemloos ingelezen en verwerkt (kunnen) worden.
Het MDTO-XML-schema wordt zonder herdefinities geïmporteerd binnen het diwoo-metadata-schema
voor sitemaps.
Het rootelement mdto:MDTO
wordt hiermee toegestaan binnen 'diwoo:Document'.
Het MDTO-schema, zoals gedefinieerd door het Nationaal Archief, is daarbij onveranderd
toegepast.
Dat betekent dat er een aantal MDTO-velden, conform dit schema, meegeleverd moeten
worden ('verplicht' of 'verplicht indien bekend'), die op dit moment echter niet,
of nog niet, betekenisvol verwerkt kunnen worden door de Woo-harvester (zie hieronder).
In de bijbehorende XSD worden meerdere MDTO-elementen binnen diwoo:Document
toegestaan.
Hiervoor is gekozen zodat bij een "document" zowel een mdto:Informatieobject
als een (daaraan gerelateerd) mdto:Bestand
volgens MDTO gecodeerd kan worden.
Er kunnen daarnaast ook andere MDTO-elementen toegevoegd worden binnen een diwoo:Document
, maar de informatie daarin zal dan door de Woo-harvester worden genegeerd.
<url>
<loc>hier moet de juiste loc</loc>
<!-- optionele eigenschappen van sitemap:url -->
<lastmod>2022-09-02T00:00:00+02:00</lastmod>
<changefreq>weekly</changefreq>
<priority>1</priority>
<!-- MDTO binnen diwoo:Document -->
<diwoo:Document>
<mdto:MDTO>
<mdto:informatieobject>
<!-- hier de kenmerken van informatieobject -->
</mdto:informatieobject>
</mdto:MDTO>
<mdto:MDTO>
<mdto:bestand>
<!-- hier de kenmerken van bestand -->
</mdto:bestand>
</mdto:MDTO>
<!-- hier kunnen optioneel eigenMetadata worden ingevoerd -->
</diwoo:Document>
</url>
Aanbevolen metadatavelden
Op pagina Aanbevelingen voor metadata is aangegeven welke metadata aanbevolen zijn, omdat de Woo-harvester daarmee de documenten
en hun metadata op een betekenisvolle wijze kan verwerken.
Ook is op die pagina aangegeven hoe deze metadata gepresenteerd wordt op open.overheid.nl
en welke van deze metadata als filter op dat portaal gebruikt kan worden.
Deze aanbevelingen gelden onverkort ook voor aanleveringen in MDTO. De volgende paragrafen geven aanbevelingen die specifiek voor MDTO-metadata gelden. De totale set van de op dit moment door de harvester ondersteunde MDTO-metadata is vastgelegd en gespecificeerd in de XSD. Een aantal voorbeeldsitemaps die gebruik maken van deze metadata zijn te downloaden onderaan deze pagina.
publisher
Met de uitgever (publisher) wordt de organisatie bedoeld die het document openbaar heeft gemaakt. We staan het, in deze specificatie, toe om deze als 'archiefvormer' of als 'betrokkene' te modelleren in MDTO. In beide gevallen moet er dan wel, in het 'identificatiekenmerk' verwezen worden naar de betreffende tooi_id. Als de diwoo:publisher niet wordt toegevoegd aan het document dan wordt deze afgeleid uit de id van de publicerende organisatie uit de Woo-index (register voor overheidsorganisaties).
Zie corresponderend XSD-element 'archiefvormer' van Type "verwijzingGegevens" resp. 'betrokkene'van Type "betrokkeneGegevens".
Opmerking:
Omdat op open.overheid.nl de 'verantwoordelijke' organisatie van het document wordt getoond, en niet de publisher, is het aan te bevelen om de 'verantwoordelijke' organisatie mee te geven als documentmetadata in de sitemap. Dat kan door deze als 'betrokkene' te modelleren in MDTO. Bij afwezigheid van dit veld neemt de harvester de waarde van publisher over als de te tonen verantwoordelijke organisatie.
officieleTitel
De "officieleTitel" kan aangeleverd worden als 'naam' van het betreffende MDTO-informatieobject. De titel van een geharvest document wordt prominent getoond op open.overheid.nl. Het is dus belangrijk om de titel van het document, zoals dat getoond moet worden, expliciet mee te geven in de metadata van het betreffende document.
Zie corresponderend XSD-element 'naam' van complexType "objectType" (string).
informatiecategorie
Van elk document dient de corresponderende informatiecategorie bekend te zijn. Dit kan door de betreffende TOOI id op te nemen in de 'begripcode' van een mdto:classificatie. Het is hierbij mogelijk om een document aan meerdere informatiecategorieën te relateren.
Zie corresponderend XSD-element classificatie van type "BegripGegevens".
Documenthandeling
Met een documenthandeling kan worden aangegeven op welke datum een officiële handeling met betrekking tot het document heeft plaatsgevonden. In MDTO kan dit gespecificeerd worden als een event met een EventType.
In MDTO dienen bij een event
de volgende waarden aangegeven te worden:
- De verantwoordelijke actor: de organisatie die de documenthandeling heeft uitgevoerd: mdto:eventVerantwoordelijkeActor, geïdentificeerd met een tooi_id in identificatieKenmerk
- De uitgevoerde handeling: hiervoor wordt verwezen naar de lijst van geïdentificeerde PLOOI documenthandelingen, met de waarde weergegeven in de begripcode
- Het tijdstip van handeling: de eventTijd
Zie corresponderend XSD-element event van type "eventGegevens".
Sitemap voorbeelden in MDTO-formaat
De volgende voorbeelden van sitemaps conform deze MDTO-specificatie zijn beschikbaar:
- sitemap-mdto-alleenverplicht.xml: een sitemap met alleen de verplichte metadata in MDTO-formaat
- sitemap-diwoo-en-eigenmetadata.xml: een voorbeeld waar naast MDTO-metadata ook naam/waarde-paren gebruikt worden
- sitemap-mdto-hooigracht.xml: een wat uitgebreider voorbeeld van een sitemap bestaande uit een informatieobject en een bestand