ETag: mehr Speed & besseres Crawling

Der ETag ist ein Feld im HTTP-Header, das zum Caching und zur Vermeidung redundanter Datenübertragungen erdacht wurde. Das ETag wurde im HTTP-Protokoll der Version 1.1 eingeführt und im RFC-2616 definiert. Soweit die Eckdaten. Aber was lässt sich mit dem ETag anfangen und weshalb sollte man es als SEO kennen?

Grundsätzlich ist ein ETag eine Art Fingerabdruck für eine Datei, anhand derer sich Datei-Änderungen ablesen lassen. Das klingt erst einmal wenig spannend, immerhin senden Web-Server gewöhnlich die Information „Last-Modified“ im HTTP-Header. Werden Dateien jedoch regelmäßig automatisiert erzeugt und auf den Server kopiert, wie dies bei XML-Sitemaps der Fall ist, so hat sich der Dateiinhalt unter Umständen nicht geändert, die Datei wurde im Dateisystem jedoch geändert. In solchen Fällen würde Last-Modified eine Aktualisierung anzeigen, der ETag jedoch nicht. Voraussetzung ist selbstverständlich, dass der ETag sich aus dem Inhalt einer Ressource berechnet.

Prinzipiell könnte der ETag auch eine zufällig generierte, einmalige Zahl zur Identifikation sein, so etwas ist jedoch nicht sinnvoll. Auch die gängige Berechnung auf Basis des Inode einer Datei ist wenig sinnvoll. Das Inode ist bei Auslieferung über verschiedene Server oder z.B. ein CDN abhängig vom Speicherort auf dem Dateisystem. Damit hat dieselbe Datei auf unterschiedlichen Servern abweichende ETags. Hinzu kommt, dass die Nutzung des Inode als ETag für Sicherheitslücken in der Vergangenheit verantwortlich war. Sinnvoller und in der Praxis erprobt ist die Erzeugung des ETag mit Hilfe kryptographischer Hashfunktionen wie zum Beispiel MD5 (Message-Digest Algorithm 5).

Je nach Art des Inhalts bieten sich unterschiedliche Herangehensweisen bei der Erzeugung des ETag an. Bei Binärdateien kann der Hash-Wert direkt aus der Datei erzeugt werden. Bei HTML-Dateien ist dies unter Umständen nicht sinnvoll. Inhalte auf Webseiten klassifiziert Google laut den internen Quality Rater Guidelines folgendermaßen:

  • Main Content (MC)
  • Supplementary Content (SC)
  • Advertisements (Ads)

Hier wäre es zielführender, wenn lediglich der Main Content für die Hash-Generierung genutzt wird. Andernfalls würde durch Einbau eines neuen Werbeelements oder eines „dies könnte Sie auch interessieren“-Inhalts der ETag sich ändern, obwohl der eigentliche Inhalt der HTML-Seite unverändert geblieben ist.

Die Besonderheit dieses HTTP-Headers liegt zudem in den zwei möglichen Ausprägungen. Grundsätzlich unterscheidet man zwischen einem „starken ETag“ und einem „schwachen ETag“.

Starker ETag

Ein starker ETag darf nur dann von mehreren Daten-Objekten per http-Header ausgegeben werden, falls diese Dateien Bit für Bit absolut identisch sind. Wird also eine Datei mehrfach auf den Server geladen, so sind diese auf Bit-Ebene 100% identisch und sollten identische Hash-Werte für den ETag ausgeben.

Schwacher ETag

Ein schwacher ETag wird durch das „W/“-Präfix im http-Header gekennzeichnet. Er darf von mehreren Daten-Objekten per http-Header ausgegeben werden, falls diese gleich oder gleichwertig sind und sich semantisch nicht signifikant unterscheiden. Beispiele hierfür können Bilddateien sein, die mehrfach erzeugt werden und ein abweichendes Logo als Wasserzeichen oder Branding enthalten. Ebenso könnten zwei HTML-Seiten mit selbem Inhalt, aber abweichender, optischer Aufmachung dasselbe ETag verwenden, solange das „W/“-Präfix im http-Header gesetzt ist.

Crawling-Optimieren

Die Erzeugung und Ausgabe eines ETags gibt einem Crawler somit die Information, ob ein Inhalt bzw. eine Datei sich geändert hat. Ein erneuter Abruf des Inhalts ist daher nur bei geändertem Hash-Wert erforderlich. Suchmaschinen können somit bereits nach dem Austausch der http-Header entscheiden, ob sie den eigentlichen Inhalt noch abrufen. Dies verbessert das Crawling durch Suchmaschinen, gleichzeitig führt es bei Besuchern einer Website zu einer schnelleren Ladegeschwindigkeit durch optimiertes Caching.

Das ETag bietet einige Optimierungsmöglichkeiten. Wer seine Website nachhaltig optimieren möchte und Nutzern wie auch Suchmaschinen einen Geschwindigkeitsvorteil bieten will, sollte sich mit den Möglichkeiten dieser technischen Optimierung auseinandersetzen. Zur Implementierung bedarf es jedoch eines sinnvollen Konzepts. Nutzen sollte man ETags jedenfalls nicht nur auf großen Websites.

Von |2018-11-08T11:05:13+00:0029. Dezember 2017|SEO|