Sitemap 2026
Was ist eine Sitemap?
Eine Sitemap ist das digitale Inhaltsverzeichnis einer Webseite, das die gesamte Seitenstruktur logisch abbildet.
Welche Sitemaps gibt es?
Es gibt 2 Sitemaps, beide benötigen einen gewissen Pflegeaufwand und haben unterschiedliche Aufgaben:
- sitemap.xml
- sitemap.html
1. Die sitemap.xml – für die Bots
Die technische sitemap.xml Variante ist die Sitemap für die Bots.
Welche Aufgabe hat die sitemap.xml?
Die Sitemap.xml hat die Aufgabe, die Bots über die Änderungen auf der Website zu informieren und dient Suchmaschinen und modernen KI-Systemen als strukturierter Daten-Wegweiser. Sie sorgt dafür, dass sowohl Menschen als auch Bots die Architektur der Website sofort verstehen und kein wichtiger Inhalt beim Indexieren übersehen wird.
2. Die sitemap.html – für die Menschen
Die sitemap.html ist meistens im Footer der Website als Sitemap verlinkt und ist für die Besucher. Deshalb hat sie eine sog. „Baum-Struktur“ und schaut „schöner“ aus, für uns Menschen.
Welche Aufgabe hat die sitemap.html?
Die Sitemap.html hat eigentlich keine bestimmte technische Funktion, aber viele Webmaster nutzen sie für eine Übersicht und verlinken sie im Footer, oft z.B. bei Onlineshops, als visuelle HTML-Version die menschlichen Besuchern bei der Navigation hilft.
Für die Bots: die sitemap.xml
Die sitemap.xml Datei gibt verschiedene Daten an die Crawler der Suchmaschinen aus:
- loc = Location = URL der Unterseite, wird automatisch gezogen
- lastmod = Last modified = letzte Überarbeitung der Unterseite (Ausgabe über Server, meistens das Datum der letzten Speicherung, kann z.B. in WordPress aktiv gesetzt werden)
- changefreq = Change frequency = wie oft die Seite überarbeitet wird. Änderungsfrequenz: täglich, wöchentlich, monatlich. Täglich sollte nur für Startseite gelten.
- priority = Priorität = wie wichtig die Seite im Vergleich zu den anderen Seiten dieser Webseite ist
Es gibt noch weitere Einstellungen, aber das waren früher (bis 2020) die 4 Wichtigsten.
3 Tipps für die Sitemap
Die Realität 2026: Google ignoriert changefreq und priority komplett, das wird zumindest behauptet und es macht auch technisch Sinn.
Die Algorithmen sind mittlerweile so fortschrittlich, dass sie die tatsächlichen Update-Zyklen und die Relevanz einer Seite weitaus besser selbst berechnen (Stichwort: Hash-Werte). Das Einzige, worauf Google in einer XML-Sitemap neben der URL (loc) wirklich noch achtet, ist das lastmod-Tag (sofern es sauber und wahrheitsgemäß übermittelt wird).
- die Einstellungen changefreq = Change frequency und priority = Priorität sollten (um die Datei möglichst klein und übersichtlich zu halten) entfernt werden
- pro Sitemap.xml-Datei sollten nicht mehr als 10.000 URLs übergeben werden, bei mehr URLs die Datei aufteilen und mit Nummern fortlaufend markieren, diese Liste dann in einer übergeordneten Sitemap für die Bots auflisten
- statt ein Update-Datum zu „fälschen“ sollte man die Energie darin investieren wichtige Inhalte tatsächlich regelmäßig upzudaten – heute muss es eben der beste Content zum Thema sein, der Durchschnitt reicht nicht mehr gegen KI / AI
Google nutzt die Sitemap heute vor allem als Wegweiser, um neue oder aktualisierte Seiten schneller zu finden, anstatt mühsam dem internen Linknetzwerk folgen zu müssen. Der Google-Bot holt sich die Sitemap heute aus der robots.txt oder aus der Google Search Console, wo sie hinterlegt wird.
Google achtet dabei ganz besonders auf folgende Aspekte:
1. Ein verlässliches lastmod-Tag
Das ist der wichtigste Hebel, den es aktuell gibt.
Google nutzt das „Last Modified“-Datum intensiv für das Crawl-Budget – allerdings nur, wenn es glaubwürdig ist.
Der Vertrauensfaktor: Wenn das System bei jeder kleinsten Design-Änderung im Footer das lastmod-Datum aller 10.000 URLs auf denselben Tag setzt, merkt Google das und ignoriert das lastmod-Tag für diese Website komplett.
Best Practice: Das Datum sollte sich nur ändern, wenn sich der Hauptinhalt der jeweiligen Seite wirklich und signifikant geändert hat.
2. Absolute URL-Hygiene (Nur Index-Signale)
Google nutzt Sitemaps, um zu verstehen, welche Seiten dieser Webseite wirklich wichtig sind. Eine Sitemap sollte eine fehlerfreie Liste deiner besten Seiten sein. Google verliert schnell das Vertrauen in die Datei, wenn sie „schmutzig“ ist.
Was nicht in die Sitemap darf:
- URLs mit noindex,
- per robots.txt gesperrte Seiten,
- Duplikate (auch: URL mit falschem Canonical),
- Parameter-URLs sowie
- Statuscodes wie 404 oder
- 301-Weiterleitungen.
Die Konsequenz: Schickst du Google zu viele fehlerhafte URLs in der Sitemap, stuft der Bot die Priorität der gesamten XML-Datei herunter und crawlt sie seltener.
3. Spezial-Erweiterungen (Bilder, Videos, News, hreflang)
Während die Standard-Tags abgespeckt wurden, liest Google spezifische Medien- und Sprach-Erweiterungen in der Sitemap nach wie vor sehr präzise aus:
Bilder & Videos
image:image und video:video helfen Google, Medieninhalte auf der Seite korrekt zuzuordnen – besonders bei dynamisch nachgeladenen Inhalten (JavaScript).
Internationalisierung
Wenn hreflang-Verknüpfungen nicht im HTML-Head untergebracht werden (können), ist die XML-Sitemap der sauberste Ort dafür. Google verarbeitet diese Sprach-Cluster hier fehlerfrei.
Google pingt nicht mehr – seit Ende 2023
Google hat den alten „Sitemap-Ping“ (über den man Google aktiv per URL-Aufruf über eine neue Sitemap informieren konnte) im Juni 2023 abgeschaltet.
Der Bot verlässt sich heute darauf, dass die Sitemap in der robots.txt hinterlegt ist oder einmalig in der Google Search Console eingereicht wurde.
Danach steuert Google die Abrufhäufigkeit der Sitemap komplett selbst – je nachdem, wie oft sich die Website historisch verändert.
Gary Illyes von Google erklärt zu LastMod auf der Developers Seite explizit, dass der Ping-Endpunkt wegen massivem Spam abgeschaltet wurde und Google sich stattdessen voll auf ein verlässliches lastmod-Tag konzentriert. Auch das Ignorieren von changefreq und priority wird hier offiziell bestätigt:
Das lastmod-Element
Im Laufe der Jahre haben wir festgestellt, dass das lastmod-Element auf den Websites, die es bereitstellen, unterschiedlich nützlich ist. Das kann auf die Art der veröffentlichten Inhalte zurückzuführen sein oder auch auf das CMS (Content-Management-System). lastmod ist mittlerweile tatsächlich in vielen Fällen nützlich und wir verwenden es als Signal bei der Planung von Crawling-Vorgängen für URLs, die wir zuvor gefunden haben.
Damit das lastmod-Element nützlich ist, muss es in einem unterstützten Datumsformat vorliegen, das auf sitemaps.org dokumentiert ist. Die Search Console sagt euch, wenn das nicht der Fall ist, nachdem ihr eure Sitemap eingereicht habt. Zweitens muss alles mit der Realität übereinstimmen: Wenn sich eure Seite vor 7 Jahren geändert hat, ihr aber im lastmod-Element angebt, dass sie sich gestern geändert hat, werden wir euch nicht mehr glauben, wenn es um das Datum der letzten Änderung eurer Seiten geht.
Ihr könnt ein lastmod-Element für alle Seiten eurer Sitemap verwenden oder nur für die, bei denen ihr euch sicher seid. Manche Websitesoftware kann beispielsweise eventuell nicht genau erkennen, wann die Startseite oder eine Kategorieseite zuletzt geändert wurde, da lediglich die anderen Seiten auf der Website aggregiert werden. In diesen Fällen könnt ihr lastmod für diese Seiten weglassen.
Wenn wir von „letzte Änderung“ sprechen, meinen wir damit die letzte nennenswerte Änderung. Wenn durch euer CMS nur ein unwesentlicher Text in der Seitenleiste oder Fußzeile geändert wird, müsst ihr den lastmod-Wert für diese Seite nicht aktualisieren. Wenn ihr jedoch den primären Text geändert, strukturierte Daten hinzugefügt oder geändert oder einige Links aktualisiert habt, aktualisiert den lastmod-Wert.
Fazit
Die klassische sitemap.xml hat sich von einer starren Prioritäten-Liste zu einem dynamischen, hocheffizienten Wegweiser für Suchmaschinen-Crawler entwickelt.
Durch spezialisierte Erweiterungen für Bilder, Videos oder tagesaktuelle News liefern die Sitemaps den Bots wertvolle Medien-Metadaten direkt an der Quelle, die beim reinen Abgrasen des HTML-Codes oft unentdeckt bleiben.
Da moderne Algorithmen fehlerhafte Angaben jedoch sofort mit Ignoranz strafen, ist die absolute Korrektheit dieser Daten der entscheidende Hebel.
Nur eine perfekt gepflegte Sitemap stellt sicher, dass das kostbare Crawl-Budget (die Zeit, die ein Bot für deine Website aufwendet) effizient genutzt wird und die wichtigsten Inhalte im Index landen.
Weitere Informationen
- Sitemaps.org: Best Practices – Protocol – hier werden alle unterstützten Sitemap-Formate sowie die spezifischen Medien-Erweiterungen im Detail erklärt
- Google Developers: Allgemeine Informationen zu Sitemaps
- Google Developers: Sitemap erstellen und einreichen
- SEOwoman: Google Search Console Sitemap löschen (mit Video)

