Sitemap-voorbeelden

Ter illustratie volgen hier een aantal voorbeelden hoe aan de Woo-harvester doorgegeven wordt dat documenten toegevoegd, gewijzigd of verwijderd moeten worden.

Toevoegen van een document aan een nieuwe informatiecategorie

Als een document wordt toegevoegd aan een informatiecategorie die het bestuursorgaan nog niet eerder heeft ontsloten, dan zijn voor een goede werking onderstaande zaken noodzakelijk:

  • Registeren URL voor deze informatiecategorie in ROO/verwijsindex (bijvoorbeeld: documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten)
  • Op de host van deze URL een nieuw sitemapindexbestand opnemen conform de naamgevingsconventie (bijvoorbeeld documenten.bestuursorgaan.nl/sitemaps/sitemapindex-diwoo-infocat015.xml)
  • Op deze host een sitemap aanmaken (bijvoorbeeld documenten.bestuursorgaan.nl/sitemaps/sitemap-onderzoekrapporten1.xml)
  • In deze sitemap een url-veld aanmaken met daarin een verwijzing naar het gepubliceerde document
  • In de robots.txt van de host van deze URL een verwijzing opnemen naar het sitemapindexbestand. In dit voorbeeld staat de robots.txt op  documenten.bestuursorgaan.nl/robots.txt)

In voorbeeldsnippets:

sitemapindex-diwoo-infocat015.xml

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <sitemap>
      <loc>https://documenten.bestuursorgaan.nl/sitemaps/sitemap-onderzoeksrapporten1.xml</loc>
   </sitemap>
</sitemapindex>

Sitemap-onderzoeksrapporten1.xml

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>https://documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten/rapport_123.pdf</loc>
   </url>
</urlset>

Toevoeging robots.txt

...
Sitemap: /sitemaps/sitemapindex-diwoo-infocat015.xml
...

Toevoegen van een document aan een bestaande informatiecategorie

  • Zoek in de sitemapindexbestand behorende bij deze informatiecategorie (bijvoorbeeld documenten.bestuursorgaan.nl/sitemaps/sitemapindex-wooverzoeken.xml) waar het sitemap-bestand staat
  • Controleer of er nog voldoende plek is in de sitemap (maximaal 50.000 URLs en maximaal 50MB) 
    • Zo nee, maar een nieuwe sitemap.xml aan en neem deze ook op in het sitemap-bestand
  • In de sitemap.xml een url-veld aanmaken met daarin een verwijzing naar het gepubliceerde document

Zie voorgaande snippets voor voorbeelden die hierbij horen.

Verplaatsen van een bestaande document

  • Zoek het sitemapbestand waarin de document staat
  • Verander de locatie in het loc-veld naar de nieuwe URL van het document
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <!-- Dit is de oude locatie van het document: 
         <loc>https://documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten/rapport_123.pdf</loc> 
      -->
      <loc>https://documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten-en-adviezen/rapport_123.pdf</loc>
   </url>
</urlset>

Updaten van een bestaande document

  • Zoek het sitemapbestand waarin de document staat
  • Verander het tijdstip in het lastmod-veld naar de nieuwe timestamp van de document
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>https://documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten-en-adviezen/rapport_123.pdf</loc>              <!--
        De oude lastmod datum: <lastmod>2005-01-01</lastmod>
      -->
      <lastmod>2023-05-12</lastmod>
   </url>
</urlset>

Verwijderen van een document

  • Zoek het sitemapbestand waarin de document staat
  • Verwijder de gehele url inclusief onderliggende velden van dit document
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <!-- 
        De gehele url verwijderen inclusief onderliggende velden uit de sitemap
   <url>
      <loc>https://documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten-en-adviezen/rapport_123.pdf</loc>         
      <lastmod>2023-05-12</lastmod>
   </url>
   -->
</urlset>

Toevoegen metadata

De volgende voorbeelden van sitemaps met Woo-metadata in de vorm XML-documenten zijn beschikbaar die consistent zijn met de diwoo-metada.xsd:

Deze voorbeelden zijn als één zip te downloaden.