TOOI - TOP-thesaurus 1.1.2

KOOP Standaard
Vastgestelde versie

Deze versie:
https://standaarden.overheid.nl/tooi/doc/def-st-tooi-thes-top/-20240129
Laatst gepubliceerde versie:
https://standaarden.overheid.nl/tooi/doc/tooi-thes-top/
Redacteur:
TOOI-beheerteam (KOOP)
Auteur:
Kennis- en Exploitatiecentrum voor Officiële Overheidspublicaties (KOOP)

Status van dit document

Dit is de definitieve versie van dit document. Wijzigingen naar aanleiding van consultaties zijn doorgevoerd.

Samenvatting

Het doel van TOOI is het definiëren van een gemeenschappelijke taal waarmee data en metadata uitgedrukt kunnen worden, zodat overheidsinformatie beter vindbaar, toegankelijk, interoperabel en herbruikbaar wordt. TOOI-top (tooitop) bevat de taxonomie van beleidsthema’s voor het Basis wettenbestand.

De familie van TOOI-documenten

Dit document maakt deel uit van de familie van TOOI-documenten die gepubliceerd wordt op standaarden.overheid.nl/tooi.

Documentatie

Dit document is gepubliceerd door KOOP, het Kennis- en exploitatiecentrum voor Officiële Overheidspublicaties. Zie het beheerplan voor nadere informatie.

Feedback is welkom

Indien u vragen heeft, of op- of aanmerkingen wilt maken op dit document, dan vindt u hier hoe u dat publiekelijk of anoniem kunt doen.

Alle commentaar is welkom.

1. Inleiding

TOOI-top (tooitop) bevat de taxonomie van beleidsthema’s voor het Basis wettenbestand. De Themaindeling voor Officiële Publicaties, kortweg de TOP-lijst genoemd, is vastgesteld door de Redactieraad Basis Wettenbestand. Het is bedoeld als een overkoepelende indeling voor collecties van officiële overheidsinformatie van zowel landelijke als decentrale overheidsorganisaties. De uitgangspunten die we in het hiernavolgende bespreken zijn eveneens door de redactieraad vastgesteld. TOOI-top is de normatieve weergave hiervan in termen van SKOS.

1.1 Principes en uitgangspunten

Bij het samenstellen van de eerste versie van de TOP-lijst zijn de collecties van Officiële Bekendmakingen en parlementaire informatie als uitgangspunt (‘corpus’) genomen. Daarbij zijn de volgende principes gehanteerd:

P1. Termen zijn met kleine letters geschreven, alleen voor namen en afkortingen worden hoofdletters gebruikt.

P2. Thema’s die in geen enkele collectie meer dan 0,5% van de content uitmaken worden verwijderd.

P3. Een nieuw thema kan aan de TOP-lijst worden toegevoegd als dit, naar verwachting van de beheergroep, meer dan 0,5% van de content van een collectie uitmaakt.

P4. De TOP-lijst behoudt ongeveer de omvang van de Taxonomie Beleidsagenda en bestaat uit twee lagen. Er wordt gestreefd naar een laag van ongeveer 16 hoofdthema’s en een laag van 80 tot 90 subthema’s. Elk hoofdthema heeft bij voorkeur niet minder dan 3 en niet meer dan 10 subthema’s.

P5. De TOP-lijst is een ‘levende’ lijst. Dat betekent dat applicaties die de TOP-lijst gebruiken om te metadateren voorbereid moeten zijn op aanpassingen van de TOP-lijst. Ze moeten dus om kunnen gaan met nieuwe thema’s, verdwijnende thema’s en opsplitsingen en samenvoegingen van thema’s.

P6. Een publicatie kan meerdere thema’s toegekend krijgen. Combinaties zijn een krachtig middel om de omvang van de themaindeling enigszins in te perken.

Bijvoorbeeld: handelsverdragen vallen zowel onder het thema “handel” als onder het thema “internationaal”.

P7. Zowel de hoofdthema’s als de sub-thema’s kunnen worden gebruikt. Er zijn geen sub-thema’s “overig…”. Publicaties die niet onder een van de subthema’s vallen, worden onder het hoofdthema geplaatst.

P8. De scope van de TOP-lijst bestaat uit de officiële publicaties van de gehele overheid, zowel centraal als decentraal.

P9. Onder thema wordt het beleidsthema verstaan waarover de inhoud van een publicatie gaat. Beleidsinstrumenten, zoals evaluatie, verantwoording, toezicht, handhaving, uitkeringen, toelagen, zijn op zichzelf geen beleidsthema’s. Publicaties die in een van deze categorieën van instrumenten vallen worden ingedeeld onder het betreffende inhoudelijke thema.

Bijvoorbeeld: “uitkeringen” is geen thema in de TOP-lijst. Een publicatie over de AOW valt onder “sociale zekerheid” | “ouderen”.

1.2 Toepassing

1.2.1 Scope

De TOP-lijst is een aanbodgerichte thema-indeling. Dat betekent dat de thema’s primair gekozen worden op basis van het aanbod van content (kwantitatief). De organisatie van de aanbieders (departementen en afdelingen) is dan ook vaak te herkennen in de thema-indeling, maar die is niet primair leidend. De TOP-lijst is bij uitstek geschikt om door de aanbieder van de content te worden toegekend en de professional – die het aanbod goed kent – zou de thema’s kunnen gebruiken om content te vinden.

Een vraaggerichte thema-indeling is doelgroep-afhankelijk, kan op punten afwijken van een aanbodgerichte indeling en kan beter worden ontwikkeld en worden toegepast door specialisten in het domein van de specifieke doelgroep.

1.2.2 Toekennen van thema’s

De TOP-lijst kent twee niveaus: hoofdthema’s en subthema’s. Beide kunnen worden toegekend als metadata-waarde. Uiteraard wordt een grotere precisie bereikt indien zo veel mogelijk de sub-thema’s worden gebruikt. Als bepaalde content niet in een van de sub-thema’s kan worden ingedeeld kan een hoofdthema worden toegekend. Het gebruik van subthema’s “overige …” wordt als bad practice beschouwd. (principe P7)

Het is aan te bevelen om applicaties geschikt te maken om meerdere thema’s te kunnen toekennen. Zo kunnen evenementenvergunningen bijvoorbeeld onder subthema “evenementen” worden ingedeeld, maar tevens onder “veiligheid”.

1.2.3 De TOP-lijst is een levende lijst

Op basis van implementaties en door het leggen van relaties met andere thema-indelingen kunnen nieuwe inzichten ontstaan die tot aanpassing van de lijst leiden. De TOP-lijst is zo ook ontstaan uit de TBA. Omdat de TBA al een aantal jaren niet was geëvalueerd is er sprake een relatief groot aantal verschillen.

Applicaties die de TOP-lijst toepassen moeten rekening houden met een aantal soorten wijzigingen.

  • Een nieuw thema moet worden opgenomen in invoerschermen en indices en in sommige gevallen ook in zoekschermen. Vanaf dat moment kan het worden toegepast.
  • Een op te heffen thema wordt ondergebracht bij een bestaand thema. Applicaties moeten het op te heffen thema verwijderen uit de invoerschermen en een keuze maken of bestaande metadata met het oude thema wordt bijgewerkt naar het thema waaronder het oude thema is ondergebracht of dat met behulp van query-expansie gezorgd wordt dat zoekvragen correct resultaat geven op basis van de oude metadata.
  • Thema’s die worden samengevoegd zijn vergelijkbaar met het vorige geval.
  • Een thema dat wordt opgesplitst kan op twee manieren worden verwerkt. Alle content die onder het oude thema is ingedeeld kan beoordeeld worden en onder een van de nieuwe thema’s worden ingedeeld. Dat zal een handmatig of geprogrammeerd proces zijn. De andere optie is om alle nieuwe thema’s toe te kennen aan deze content. Dat zal minder nauwkeurig zijn, maar ook minder complex.

1.3 Implementatie

De TOP-lijst is geïmplementeerd in SKOS, zie [skos-reference]. De thema’s zijn dus resources van het type skos:Concept. De thema’s worden aan eindgebruikers gepresenteerd als termen, maar hebben ook een http-URI die geschikt is voor machineleesbaarheid van de metadata. Het wordt aanbevolen om in een applicatie de URI op te nemen en de labels er (al dan niet dynamisch) bij te halen. De TOP-lijst zal in verschillende formats beschikbaar gesteld worden, zodat applicaties de thema’s geautomatiseerd kunnen verwerken.

1.4 Organisatie van het beheer

Opdrachtgever voor de Themaindeling voor Officiële Publicaties (TOP-lijst) is de redactieraad voor het Basis Wettenbestand (redactieraad BWB). Het beheer is belegd bij de beheergroep Themaindeling voor Officiële Publicaties (beheergroep TOP). Het Kennis- en exploitatiecentrum voor Officiële OverheidsPublicaties (KOOP) organiseert het redactieproces, het technisch beheer en publicatie van de lijst op https://standaarden.overheid.nl. De beheergroep zal tenminste elk half jaar nagaan of er aanleiding is de TOP-lijst aan te passen.

De beheergroep beoordeelt de TOP-lijst op twee aspecten: de manier waarop de thema’s op verschillende collecties worden toegepast en een vergelijking van de TOP-lijst met met andere potentieel relevante thema-indelingen.

Bij de toepassing wordt gekeken naar kwantiteit en kwaliteit. Als thema’s te weinig worden toegepast kunnen ze uit de TOP-lijst worden verwijderd. Wanneer thema’s zo groot worden dat ze niet onderscheidend genoeg meer zijn kan worden onderzocht of een thema kan worden opgesplitst. Als een thema verkeerd wordt toegepast wordt gekeken wat daar de oorzaak van is en of wellicht een andere term vergissingen kan reduceren.

Bij vergelijking met andere relevante indelingen kan het opportuun zijn om thema’s aan te passen, zodat het eenvoudiger wordt om content uit te wisselen met een applicatie die een andere indeling hanteert. Kandidaten zijn: de thema-indeling gehanteerd door bijvoorbeeld LINK Rijksoverheid.nl of RVO en thema-indelingen die in Europees verband worden gevraagd of voorgeschreven, zoals die van de Inspire-richtlijn, de diensten-richtlijn of voor het Europese dataportaal.

A. Referenties

A.1 Informatieve referenties

[skos-reference]
SKOS Simple Knowledge Organization System Reference. Alistair Miles; Sean Bechhofer. W3C. 18 August 2009. W3C Recommendation. URL: https://www.w3.org/TR/skos-reference/
KOOP Standaard - Vastgestelde versie