HTTP ETag

aus Wikipedia, der freien Enzyklopädie

ETag (für entity tag, etwa ‚Entitäts-Kennzeichen‘) ist ein im HTTP 1.1 eingeführtes Header-Feld. Es dient zur Bestimmung von Änderungen an der angeforderten Ressource und wird hauptsächlich zum Caching, also der Vermeidung redundanter Datenübertragungen, verwendet.

Spezifikation

Beispiel HTTP Header

Der ETag-Wert ist eine beliebige von Anführungszeichen umschlossene Zeichenkette, die zusätzlich durch das Präfix „W/“ als schwaches ETag gekennzeichnet werden kann. Die spezifizierende BNF dazu:

ETag = "ETag" ":" entity-tag
entity-tag = [ weak ] opaque-tag
weak       = "W/"
opaque-tag = quoted-string
Starker ETag
Ein starker ETag darf nur dann von mehreren Entitäten einer Ressource geführt werden, falls diese absolut identisch (Bit für Bit) sind.
Schwacher ETag
Ein schwacher ETag (durch „W/“-Präfix gekennzeichnet) darf von mehreren Entitäten einer Ressource geführt werden, falls diese zueinander äquivalent sind, sich also semantisch nicht signifikant unterscheiden.

Häufig basiert die Generierung des ETag-Werts auf dem Hash des Inhalts der Ressource oder dem Zeitpunkt der letzten Änderung.

Ablauf

Bei der ersten Anfrage einer Ressource sendet der Server einen für diese Ressource spezifischen ETag-Wert im ETag-Header-Feld, der vom Client zusammen mit der Ressource lokal gespeichert wird. (Abb. 1) Bei einer erneuten Anfrage derselben Ressource sendet der Client in dem Header-Feld If-None-Match den zuvor gespeicherten ETag-Wert mit. (Abb. 2) Auf der Server-Seite wird nun der gesendete ETag-Wert mit dem aktuellen verglichen und bei Übereinstimmung mit dem Statuscode 304 beantwortet. (Abb. 3) Die Daten der Ressource werden in diesem Fall nicht mitgeschickt und der Client verwendet die lokal gespeicherten Daten.

Probleme

Bei ungeschickter Implementierung kann sich der ETag negativ auswirken: Wenn der ETag zum Beispiel aus der Inode des auszuliefernden Dokuments generiert wird, ist dieser Wert nur auf diesem System gültig. Wird das Dokument nun von mehreren Servern ausgeliefert (z. B. zwecks Server-Lastverteilung), so kann eine erneute Anfrage des Clients von einem anderen Server mit einem anderen ETag-Wert verarbeitet werden, was wiederum die Übertragung derselben Datei trotz ETags zur Folge hat. Aus diesem Grund wird empfohlen, die Inode bei der Generierung des ETag-Werts nicht zu verwenden.

Zur Generierung des ETags sollte beispielsweise ein Hashwert über den Inhalt der Datei oder eine eindeutige Versionsnummer der Datei verwendet werden.

Zudem können Anwender mittels ETag identifiziert werden, wenn ein Webserver client-individuelle ETags generiert.[1][2]

Weblinks

Einzelnachweise