Wie relevant ist die sitemap.xml wirklich?

Aus induux Wiki
Letzter Editor
1723
induux international
aktualisiert am 20.05.2020 - 13:23:45
Angebot
Anzeige
XML_Sitemap

Die sitemap.xml ist eine wichtige Text-Datei im XML-Format, die auf dem Webserver im Root-Verzeichnis (/) liegt und mit der der Google-Bot (-Crawler) informiert wird, welche Webseiten via Google auffindbar sein sollen. Die XML-Sitemap hilft Google beim Crawlen, durch die Übersicht aller URLs der Website. Hat Google diese Übersicht nicht, wird das Crawling-Budget verschwendet.

Frage/Definition: Was ist/sind XML Sitemap?
Auch oft gesucht: sitemap.xml, XML-Sitemap, HTML-Sitemap



{{#set: SEOCheck=1}} {{#set: checkIcon=□}} {{#set: Ergebnis=}} {{#set: PageName=XML Sitemap}}



👉 Relevanz: SEO Check / Audit
Topic:XML Sitemap
Bereich:Web-Server
Testfrage:Ist die Sitemap a) vorhanden b) ist sie richtig konfiguriert und c) aktualisiert sie sich automatisch, damit das Crawling- und Index-Budget bestmöglich genutzt wird?
QuickWin Ratio:70
Notwendigkeit:MUSS
Automatisierbar:Nein

Sitemap XML / HTML

Eine Sitemap ist eine Übersichtsseite über den Inhalt einer Webpräsenz. Diese kann entweder als HTML-Seite oder als XML-Datei realisiert sein. Das Format HTML ist gut lesbar für menschliche Besucher der Seite, während XML besser maschinenlesbar ist und sich daher hauptsächlich an Crawler oder Bots richtet.

Durch eine Sitemap wird dem Seitenbesucher eine hierarchische Struktur der Seite bereitgestellt. Dies hilft Crawlern dabei, die Seite effizienter zu indizieren und ist somit gut für das Crawling-Budget. Damit die Sitemap vom Crawler gefunden werden kann, sollte sie in der Robots.txt referenziert werden:

 Sitemap: https://www.example.com/sitemap.xml

Aktuell können in einer Sitemap 50.000 URLs aufgelistet werden und die Sitemap darf eine Größe von 50 MB nicht überschreiten. Ist die Sitemap größer oder beinhaltet mehr URLs muss eine weitere Sitemap angelegt werden.

Verwendung der Google sitemap.xml

Wie der Name schon sagt, wird die Google XML Sitemap Google übermittelt, und zwar mit der Google Search Console.

Was soll in die Sitemap?

In der Sitemap sollten nur Seiten aufgelistet werden, die für den Crawler bzw. das Ranking relevant sind.

  • Produktseiten
  • Übersichtsseiten der Produkte
  • Dienstleistungen
  • relevante Newsseiten

Was soll nicht in die Sitemap?

  • Kontakt
  • AGB
  • Impressum
  • Datenschutz
  • Karriere, Ausbildung
  • Downloads
  • Über das Unternehmen
  • Termine
  • nicht relevante Newsseiten
  • die Sitemap-Seite selbst

Das Format der sitemap.xml Datei

Die Sitemap besteht aus einem Container, der die komplette Sitemap umfasst. In diesem werden die Seiten, jeweils in einen Block pro URL unterteilt, angegeben. Diese Blöcke beinhalten die URL zur Seite im <loc> Feld sowie Eigenschaften, die die Seite beschreiben.

Damit die Suchmaschinen-Bots wichtige Seiten möglichst zu erst indizieren, bietet das Format der Sitemap einige Attribute, das Crawling-Verhalten zu steuern.

  • priority - die vom Seitenbetreiber festgelegte Priorität der einzelnen Seite an; angegeben als Wert zwischen 0 und 1, der Standardwert ist 0.5
  • lastmod - das letzte Änderungsdatum der Seite, so muss die Seite nicht erneut abgefragt werden, wenn das Änderungsdatum älter ist als die letzte Indizierung
  • changefreq - wie häufig sich die Seite ändert. Gültige Werte sind beispielsweise daily, weekly, monthly

Beispiel für einen URL-Block

Jede Unterseite der Website (hier das Beispiel mypage1.html) wird in einem solchen Block angegeben. Die Priorität wird pro Seite festgelegt und erlaubt so die Gewichtung der Seiten im Verhältnis zueinander.

<url>
   <loc>https://www.example.com/mypage1.html</loc>
   <lastmod>2019-01-25T16:27:05+00:00</lastmod>
   <priority>0.80</priority>
   <changefreq>weekly</changefreq>
</url>

XML Sitemap Generatoren

Beim Einsatz von Content Management Systeme sollte die XML-Sitemap automatisch generiert werden, da die Häufigkeit von Seitenänderungen so hoch ist, dass ein Webmaster nicht ständig die Sitemap aktualisieren kann.

Viele Content-Management-Systeme bieten daher die Möglichkeit, Sitemaps generieren zu lassen oder es gibt Plug-Ins, die diese Aufgabe erledigen.

  1. keine sitemap.xml Datei automatisch vom Web-System generiert wird
  2. die generierte Datei fehlerhaft ist und ein Abstellen der Fehler durch die Programmierung zu Aufwendig ist, z.B. bei einem Alt-System, was ehr kurz vor dem [Website Relaunch] steht.

wordpress

Für das Blog-System Wordpress gibt es einen eingebauten sitemap.xml Generator. Bitte frage Deinen Administrator.

MediaWiki

Die Wiki-Software MediaWiki erstellt standardmäßig keine Sitemap.xml. Es gibt allerdings Extensions, mit denen diese Funktion nachgerüstet werden kann, beispielsweise AutoSitemap.

Anhänge

Diese Seite hat noch keine Anhänge, du kannst aber neue hinzufügen.

Ähnliche Artikel zu Website