HZ (Zeichenkodierung)

aus Wikipedia, der freien Enzyklopädie

HZ ist eine Zeichenkodierung der chinesischen Schrift und ist in RFC 1843 beschrieben. Sie entspricht vom Zeichenumfang her GB2312, benutzt aber zum Kodieren nur die druckbaren 7-Bit-Zeichen des ASCII-Zeichensatzes und ist für Mails und das Usenet bestimmt, wo zum Zeitpunkt der Einführung 1989 nur 7-Bit-Postings erlaubt waren.

HZ ist standardmäßig im 7-bittigen ASCII-Modus, in HZ kodierte Texte, die nur ASCII-Zeichen verwenden, sind damit gültige und lesbare ASCII-Texte. Die Tilde ~ startet eine Escapesequenz: ~ und danach das Steuerzeichen für „neue Zeile“ beginnt eine neue Zeile, ~~ stellt die Tilde selbst dar, und ~{ schaltet in den GB-Modus um. Der GB-Modus ist 16-bittig, wobei das erste Byte ein Zeichen im Bereich 0x21-0x77 ist, das zweite Byte kann dann ein beliebiges druckbares ASCII-Zeichen sein. Die Escapesequenz ~} (eine ungültige GB-Sequenz) schaltet wieder zurück in den ASCII-Modus.

Der erste HZ-Dekodierer wurde vom Erfinder der Kodierung 1989 für Unix geschrieben, erst später wurden auch andere Betriebssysteme unterstützt.

Da jetzt meist auch 8-Bit-Zeichen in Mails erlaubt sind, wird HZ nicht mehr benutzt.

Weblinks

  • RFC 1843