Die Bedeutung von XML-Sitemaps für Nachrichten-Websites mit Duplicate Content-Problemen

//Die Bedeutung von XML-Sitemaps für Nachrichten-Websites mit Duplicate Content-Problemen

XML-Sitemaps werden bereits seit längerem von Google empfohlen und finden auf immer mehr Websites Anwendung. Mit XML-Sitemaps lassen sich jedoch nicht nur neue Seiten von Google schneller indexieren, sie können auch Duplicate Content-Probleme lösen.

Was ist Duplicate Content?

Duplicate Content entsteht, wenn ein und dieselben Inhalte unter mehreren URLs veröffentlicht werden. Dabei ist es irrelevant, ob Inhalte unter der gleichen Domain oder unter verschieden Domains mehrfach vorkommen. Die URLs mit denselben Inhalten stehen in direkter Konkurrenz bei Google. Im schlimmsten Fall schafft man sich dadurch mit seiner eigenen Domain interne Konkurrenz. Dies kann aber durch OnPage Optimierungen in Form von Canonical-Tags relativ leicht behoben werden. Weniger gut steuern lassen sich hingegen gleiche Inhalte, die unter externen, konkurrierenden Domains veröffentlicht werden.

Erkennt Google die Originalquelle?

Duplicate Content-Probleme können nur damit behoben werden, Google die Originalquelle erkenntlich zu machen. In der Regel geschieht dies per Canonical. Die kopierte Seite verweist mittels Canonical auf die Originalquelle und zeigt Google damit, dass sie nur die Kopie ist. Bei richtiger Anwendung von Canonicals rankt Google dann im Idealfall lediglich die Originalquelle und die Kopie kommt gar nicht erst in den Index.

Nachrichtenportale verkaufen jedoch häufig ihre Inhalte an mehre Publisher, arbeiten mit Agenturtexten oder haben damit zu kämpfen, dass externe Websites ihre Inhalte einfach so übernehmen. In diesen  Fällen wird von den externen Portalen selten ein Canonical gesetzt, sodass beide Quellen sich gegenüber Google als Originalquelle ausgeben.

Folgendes Beispiel zeigt, dass das Portal wochenblatt.de vor der Passauer Neuen Presse (pnp.de) von Google gecrawlt wurde, obwohl die Passauer Neue Presse die Originalquelle ist. Selbst die Seite localxxx.com, welche nicht einmal den gesamten Inhalt abbildet, rankt vor der Passauer Neuen Presse. Google hat das Dokument des Wochenblatts bereits 5 Stunden vor dem Dokument der Passauer Neuen Presse gecrawlt und dies damit als Original definiert.

Screenshot Google Nachrichtenartikel

Artikel „Durchreise endete für einen Serben im Gefängnis“

Verdeutlicht wird dies, wenn man eine Textpassage des Originals nimmt und in Anführungszeichen in Google eingibt. Jetzt werden innsalzach24.de und wochenblatt.de gefunden.

Screenshot Duplicate Content

Google Suche nach einer expliziten Textpassage

Alle weiteren Treffer kann man sich nur durch eine Suche, die die übersprungenen Ergebnisse mit einbezieht, anzeigen lassen.

Screenshot Duplicate Content

Google Suche unter Einbeziehung der übersprungenen Treffer

Hier wird deutlich, dass die Passauer Neue Presse den Artikel selbst zweimal unter zwei Domains (Desktop- und Mobile-Version) veröffentlicht und sich somit nochmals Konkurrenz schafft.

Screenshot Nachrichtenartikel

Copyright des Artikels liegt bei der Passauer Neuen Presse

Um sich als Originalquelle nicht den Rang ablaufen zu lassen, sollte man zusehen, dass die eigenen Inhalte schnellstmöglich in den Google Index gelangen.

Mit XML-Sitemaps sich als Originalquelle definieren

Mit XML-Sitemaps können Portale dafür sorgen, dass ihre neuen Inhalte besser und schneller von Google gefunden werden. Außerdem definieren sie die genaue Veröffentlichungszeit und machen Google damit klarer, dass sie die Originalquelle sind. Das Veröffentlichungsdatum jedes Artikels sollte daher unbedingt in der XML-Sitemap angegeben werden.

Nachrichtenportale sollten für Ihr Ranking im Google News-Bereich außerdem eine Google News-Sitemap anlegen. Die Google News-Sitemap enthält die neusten Artikel der letzten zwei Tage und sollte stetig aktualisiert werden.

XML-Sitemaps erstellen und bei Google einreichen

XML-Sitemaps können mit verschiedenen Tools, wie dem Sitemap-Generator unter xml-sitemaps.com oder Plugins, wie z.B. dem Yoast SEO Plugin beim CMS WordPress, erstellt werden. Es ist wichtig, dass die Daten in der XML-Sitemap korrekt sind und stetig aktualisiert werden.

Damit Google die Sitemap kennt und diese häufig abruft, muss sie über die Google Search Console eingereicht werden. Dafür muss lediglich die URL der Sitemap unter dem Punkt Crawling > Sitemaps hinzugefügt werden. Enthält die Sitemap Fehler, wird der Webmaster in der Google Search Console direkt darauf hingewiesen und kann diese entsprechend korrigieren.

Bei großen Seiten mit mehr als 50.000 URLs müssen mehrere Sitemaps angelegt werden und über einen Index miteinander verknüpft werden. Die Mühe ist das jedoch wert, denn Zeit ist bekanntlich Geld und wer die News am schnellsten verbreitet, gewinnt bei Google den besten Rang und damit den meisten Traffic.

Vorteile von XML-Sitemaps

  • Inhalte gelangen schneller in den Google-Index
  • Sie können Ihre Inhalte gegenüber Google als Originalquelle kenntlich machen
  • Langfristig ist eine Traffic-Steigerung durch verbesserte Rankings möglich

 

Von |2018-03-16T14:54:59+00:0018. Januar 2017|SEO|