Sitemap-voorbeelden

Ter illustratie volgen hier een aantal voorbeelden hoe aan de Woo-harvester doorgegeven wordt dat documenten toegevoegd, gewijzigd of verwijderd moeten worden.

Toevoegen van een document aan een nieuwe informatiecategorie

Als een document wordt toegevoegd aan een informatiecategorie die het bestuursorgaan nog niet eerder heeft ontsloten, dan zijn voor een goede werking onderstaande zaken noodzakelijk:

  • Registeren URL voor deze informatiecategorie in ROO/verwijsindex (bijvoorbeeld: documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten)
  • Op de host van deze URL een nieuw sitemapindexbestand opnemen conform de naamgevingsconventie (bijvoorbeeld documenten.bestuursorgaan.nl/sitemaps/sitemapindex-diwoo-infocat015.xml)
  • Op deze host een sitemap.xml aanmaken (bijvoorbeeld documenten.bestuursorgaan.nl/sitemaps/sitemap-onderzoekrapporten1.xml)
  • In deze sitemap.xml een url-veld aanmaken met daarin een verwijzing naar het gepubliceerde document
  • In de robots.txt van de host van deze URL een verwijzing opnemen naar het sitemapindexbestand. In dit voorbeeld staat de robots.txt op  documenten.bestuursorgaan.nl/robots.txt)

In voorbeeldsnippets:

sitemapindex-diwoo-infocat015.xml

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <sitemap>
      <loc>https://documenten.bestuursorgaan.nl/sitemaps/sitemap-onderzoeksrapporten1.xml</loc>
   </sitemap>
</sitemapindex>

Sitemap-onderzoeksrapporten1.xml

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>https://documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten/rapport_123.pdf</loc>
   </url>
</urlset>

Toevoeging robots.txt

...
Sitemap: /sitemaps/sitemapindex-diwoo-infocat015.xml
...

Toevoegen van een document aan een bestaande informatiecategorie

  • Zoek in de sitemapindexbestand behorende bij deze informatiecategorie (bijvoorbeeld documenten.bestuursorgaan.nl/sitemaps/sitemapindex-wooverzoeken.xml) waar het sitemap-bestand staat
  • Controleer of er nog voldoende plek is in de sitemap (maximaal 50.000 URLs en maximaal 50MB) 
    • Zo nee, maar een nieuwe sitemap.xml aan en neem deze ook op in het sitemap-bestand
  • In de sitemap.xml een url-veld aanmaken met daarin een verwijzing naar het gepubliceerde document

Zie voorgaande snippets voor voorbeelden die hierbij horen.

Verplaatsen van een bestaande document

  • Zoek het sitemapbestand waarin de document staat
  • Verander de locatie in het loc-veld naar de nieuwe URL van het document
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <!-- Dit is de oude locatie van het document: 
         <loc>https://documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten/rapport_123.pdf</loc> 
      -->
      <loc>https://documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten-en-adviezen/rapport_123.pdf</loc>
   </url>
</urlset>

Updaten van een bestaande document

  • Zoek het sitemapbestand waarin de document staat
  • Verander het tijdstip in het lastmod-veld naar de nieuwe timestamp van de document
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>https://documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten-en-adviezen/rapport_123.pdf</loc>              <!--
        De oude lastmod datum: <lastmod>2005-01-01</lastmod>
      -->
      <lastmod>2023-05-12</lastmod>
   </url>
</urlset>

Verwijderen van een document

  • Zoek het sitemapbestand waarin de document staat
  • Verwijder de gehele url inclusief onderliggende velden van dit document
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <!-- 
        De gehele url verwijderen inclusief onderliggende velden uit de sitemap
   <url>
      <loc>https://documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten-en-adviezen/rapport_123.pdf</loc>         
      <lastmod>2023-05-12</lastmod>
   </url>
   -->
</urlset>

Toevoegen metadata

Voor voorbeelden hoe metadata toegevoegd wordt aan de sitemap, zie de voorbeelden die bij de schemadocumentatie zijn toegevoegd. Hierbij moet ook het lastmod-veld worden gebruikt om aan te geven dat het document en de metadata opnieuw moet worden verwerkt.

De belangrijkste voorbeelden uit deze set zijn:

  • sitemap-uitgebreid.xml: een sitemap met alle beschikbare metadatavelden in het TOOI-formaat
  • sitemap-alleen-eigenmetadata.xml: een sitemap met alleen naam/waarde-paren
  • sitemap-diwoo-en-eigenmetadata.xml: een sitemap waar naast TOOI-formaat ook naam/waarde-paren gebruikt worden