MIME Encapsulation of Aggregate HTML Documents

aus Wikipedia, der freien Enzyklopädie

MIME Encapsulation of Aggregate HTML Documents (MHTML) ist ein Standard zum Speichern einer kompletten HTML-Seite in einer einzigen Archivdatei.

Die Abkürzung MHTML bedeutet in etwa „MIME-Einbindung von zusammengesetzten HTML-Dokumenten“. Der Standard wird von der IETF als RFC 2557 geführt.

Mit MHTML soll das Problem behoben werden, dass beim Speichern einer HTML-Seite durch den Anwender – neben der eigentlichen HTML-Datei – Grafiken und andere darauf dargestellte Elemente separat gespeichert werden müssen, was letztlich auch Änderungen an der eigentlichen HTML-Datei erfordert.

In MHTML werden Webseiten einschließlich ihrer Grafiken und anderer eingebetteter Elemente in eine kompakte Form gebracht, die als eine einzige Datei in einem MIME-fähigen Format abgelegt wird. Bestimmte Inhalte, z. B. Skripte, die nicht von derselben Domain wie die Webseite kommen, werden nicht gespeichert. MHTML-Dateien werden häufig mit der Endung .mht gespeichert.

Das Format ist wie eine MIME-E-Mail aufgebaut. MHTML wird beispielsweise bei HTML-E-Mails zum Einbetten von Bildern in der E-Mail verwendet.

Das Format wird derzeit (2018) von den Browsern Internet Explorer, Edge, Google Chrome, Vivaldi und Opera unterstützt. In der WebKit-Engine ist das Feature inzwischen auch implementiert. Für den Mozilla Firefox ist ein Add-on erforderlich, z. B. Mozilla Archive Format, with MHT and Faithful Save und unMHT; seit Firefox Quantum (Version 57) wird das MHT-Format jedoch nicht mehr unterstützt, Add-ons wie unMHT sind nicht mehr kompatibel. Bei einigen Smartphones werden Webseiten vom eingebauten Browser in diesem Format gespeichert.

Um einzelne Webseiten in einer möglichst originalgetreuen Form zu archivieren, ist MHTML ein geeignetes Mittel. Inhalte ganzer Websites hingegen können so nicht effizient archiviert werden; für solche Anlässe bietet sich z. B. wget an.

Eine andere Möglichkeit, Elemente in eine HTML-Datei einzubetten, ist die Methode Data-URL.

Ein großer Nachteil von MHTML ist die fehlende Kompression, was die gespeicherten Dokumente unnötig groß belässt. Eine effizientere Speichertechnik ist das Mozilla Archive Format. Wie bei MHTML wird ein Archiv der Webseite inklusive aller Elemente angelegt, dieses aber nicht im MIME-Format, sondern komprimiert im ZIP-Format gespeichert. Dadurch werden die Dokumente sehr viel kompakter. Mit der Extension WebScrapBook lässt sich das Format auch in aktuellen Browsern wie Firefox, Chromium, Chrome, Opera und Edge nutzen.

Weblinks