Sitemap-voorbeelden
Dit is versie 0.9.4 van de Handleiding voor de Woo-harvester. Aan dit document kunnen geen rechten worden ontleend.
Ter illustratie volgen hier een aantal voorbeelden hoe aan de Woo-harvester doorgegeven wordt dat documenten toegevoegd, gewijzigd of verwijderd moeten worden.
Toevoegen van een document aan een nieuwe informatiecategorie
Als een document wordt toegevoegd aan een informatiecategorie die het bestuursorgaan nog niet eerder heeft ontsloten, dan zijn voor een goede werking onderstaande zaken noodzakelijk:
- Registeren URL voor deze informatiecategorie in ROO/verwijsindex (bijvoorbeeld: documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten)
- Op de host van deze URL een nieuw sitemapindexbestand opnemen conform de naamgevingsconventie (bijvoorbeeld documenten.bestuursorgaan.nl/sitemaps/sitemapindex-diwoo-infocat015.xml)
- Op deze host een sitemap aanmaken (bijvoorbeeld documenten.bestuursorgaan.nl/sitemaps/sitemap-onderzoekrapporten1.xml)
- In deze sitemap een url-veld aanmaken met daarin een verwijzing naar het gepubliceerde document
- In de
robots.txt
van de host van deze URL een verwijzing opnemen naar het sitemapindexbestand. In dit voorbeeld staat de robots.txt op documenten.bestuursorgaan.nl/robots.txt)
In voorbeeldsnippets:
sitemapindex-diwoo-infocat015.xml
<?xml version="1.0" encoding="UTF-8"?>
sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://documenten.bestuursorgaan.nl/sitemaps/sitemap-onderzoeksrapporten1.xml</loc>
<sitemap>
</sitemapindex> </
Sitemap-onderzoeksrapporten1.xml
<?xml version="1.0" encoding="UTF-8"?>
urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten/rapport_123.pdf</loc>
<url>
</urlset> </
Toevoeging robots.txt
...
Sitemap: /sitemaps/sitemapindex-diwoo-infocat015.xml
...
Toevoegen van een document aan een bestaande informatiecategorie
- Zoek in de sitemapindexbestand behorende bij deze informatiecategorie (bijvoorbeeld documenten.bestuursorgaan.nl/sitemaps/sitemapindex-wooverzoeken.xml) waar het sitemap-bestand staat
- Controleer of er nog voldoende plek is in de sitemap (maximaal 50.000 URLs en maximaal
50MB)
- Zo nee, maar een nieuwe sitemap.xml aan en neem deze ook op in het sitemap-bestand
- In de sitemap.xml een url-veld aanmaken met daarin een verwijzing naar het gepubliceerde document
Zie voorgaande snippets voor voorbeelden die hierbij horen.
Verplaatsen van een bestaande document
- Zoek het sitemapbestand waarin de document staat
- Verander de locatie in het loc-veld naar de nieuwe URL van het document
<?xml version="1.0" encoding="UTF-8"?>
urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<<!-- Dit is de oude locatie van het document:
<loc>https://documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten/rapport_123.pdf</loc>
-->
loc>https://documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten-en-adviezen/rapport_123.pdf</loc>
<url>
</urlset> </
Updaten van een bestaande document
- Zoek het sitemapbestand waarin de document staat
- Verander het tijdstip in het lastmod-veld naar de nieuwe timestamp van de document
<?xml version="1.0" encoding="UTF-8"?>
urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten-en-adviezen/rapport_123.pdf</loc> <!--
< De oude lastmod datum: <lastmod>2005-01-01</lastmod>
-->
lastmod>2023-05-12</lastmod>
<url>
</urlset> </
Verwijderen van een document
- Zoek het sitemapbestand waarin de document staat
- Verwijder de gehele url inclusief onderliggende velden van dit document
<?xml version="1.0" encoding="UTF-8"?>
urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<<!--
De gehele url verwijderen inclusief onderliggende velden uit de sitemap
<url>
<loc>https://documenten.bestuursorgaan.nl/documenten/onderzoeksrapporten-en-adviezen/rapport_123.pdf</loc>
<lastmod>2023-05-12</lastmod>
</url>
-->
urlset> </
Toevoegen metadata
De volgende voorbeelden van sitemaps met Woo-metadata in de vorm XML-documenten zijn
beschikbaar die consistent zijn met de diwoo-metada.xsd
:
sitemap-alleenverplicht.xml
: een sitemap met alleen de verplichte metadata volgens dediwoo-metadata.xsd
sitemap-alleen-eigenmetadata.xml
: een voorbeeld van het gebruik van (alleen) naam/waardeparen binnen het elementextraMetadata
sitemap-diwoo-en-eigenmetadata.xml
: een voorbeeld waar naast TOOI-metadata ook naam/waarde-paren gebruikt wordensitemap-uitgebreid.xml
: een sitemap met alle TOOI-metadata plus naam/waardeparen
Deze voorbeelden zijn als één zip te downloaden.