Geschütztes Leerzeichen

aus Wikipedia, der freien Enzyklopädie

Ein geschütztes Leerzeichen (englisch no-break space, auch

non-breaking space

, abgekürzt NBSP, manchmal auch als Dauerleerzeichen bezeichnet) verhindert einen automatischen Zeilenumbruch an der Position des Leerzeichens, der die Leserlichkeit verschlechtern und den Lesefluss stören könnte. Das Zeichen entstand aus den Regeln zum Zeilensatz im Schriftsatz, als diese für die digitale Typografie umgesetzt wurden.

Digitale Typografie

Das geschützte Leerzeichen wird in HTML-Quelltexten mit dem Code   erzeugt. Im Unicode-Zeichensatz ist es an Position U+00A0 im Unicodeblock Lateinisch-1, Ergänzung zu finden.

Schmales geschütztes Leerzeichen

Neben dem gewöhnlichen geschützten Leerzeichen gibt es im Unicode-Standard auch noch ein schmales geschütztes Leerzeichen (englisch narrow no-break space, abgekürzt NNBSP, Position U+202F,  ). In der DIN 5008:2020-03 wird dies als Schmal-Leerzeichen bezeichnet; für das nicht geschützte schmale Leerzeichen wird dort keine Verwendung angegeben.

Weitere geschützte Leerzeichen

Darüber hinaus gibt es ein geschütztes Leerzeichen ohne eigene Breite (englisch

zero width no-break space

, Position U+FEFF, ), die leere Ziffer (englisch

figure space

, Position U+2007) und den mongolischen Vokalseparator (englisch

mongolian vowel separator

, abgekürzt MVS, Position U+180E), der weitgehend dem NNBSP entspricht, aber auch noch Einfluss auf die Gestalt der anliegenden Buchstaben haben kann. Das Umbruchverhalten wird im Unicode-Zeilenumbruch-Algorithmus beschrieben.

Kodierung

Die geschützten Leerzeichen werden folgendermaßen definiert und kodiert:

Internationaler Zeichenkodierungsstandard Unicode
und Kodierung im Internet-Dokumentformat HTML
Zeichen Unicode Bezeichnung HTML
Position Bezeichnung hexadezimal dezimal benannt
▕ ▏ U+00A0 no-break space geschütztes Leerzeichen      
▕ ▏ U+202F narrow no-break space schmales geschütztes Leerzeichen    
▕▏ U+FEFF zero width no-break space geschütztes Leerzeichen ohne eigene Breite1  
▕ ▏ U+2007 figure space leere Ziffer2    
▕᠎▏ U+180E Mongolian vowel separator Trenner für mongolische Vokale ᠎ ᠎
1 Veraltet, ersetzt durch U+2060 word joiner zur Unterscheidung von BOM
2 Leerraum garantiert gleicher Breite wie eine Tabellenziffer gleicher Schrift

Im ASCII-Zeichensatz aus dem Jahr 1963 sind keine geschützten Leerzeichen enthalten, weshalb viele ältere Computersysteme sie nicht darstellen konnten. Fast alle modernen Computer verwenden mindestens den im Jahr 1987 eingeführten ISO-8859-Standard und können daher zumindest das geschützte Leerzeichen U+00A0 problemlos verarbeiten und darstellen.

Anwendungsbeispiele

  • Zwischen Anrede und Namen einer Person: „Prof. Dr. Beispielhausen“ – Prof. Dr. Beispielhausen (  bzw.  ) Zumindest würde man die beiden Titel „Prof.“ und „Dr.“ zusammenhalten wollen; genauso einen einzelnen Titel „Dr.“ mit dem Nachnamen. Zwischen der Gruppe von mehreren Titeln einerseits und dem Nachnamen andererseits kann eine Trennung aber sehr sinnvoll sein; zu lange zusammenhängende Konstrukte sind zu vermeiden, und es würde ansonsten mitten im Nachnamen getrennt werden. Andernfalls entsteht eine übermäßige Lücke am rechten Rand oder Blocksatz mit riesigen Wortabständen.
  • Zwischen Zahlenwert und Maßeinheit: „44 mm“ – 44 mm.
  • Bei Schreibweise einer Zahl mit den Zahlwörtern Million und Milliarde: 23 Millionen – 23 Millionen.[1]
  • In Abkürzungen: „z. B.“ – z. B. Hier sollte eigentlich besser ein schmales geschütztes Leerzeichen („z. B.“ – z. B.) stehen. Aus Kompatibilitätsgründen wird jedoch in der Regel darauf verzichtet, da dieses Zeichen nicht von allen Webbrowsern und Schriftarten unterstützt wird. Häufig wird der Zwischenraum stattdessen auch ganz weggelassen, was jedoch gemäß DIN 5008 nicht korrekt ist.
  • Bei Sonderzeichen: „3 + 5“ – 3 + 5 und in bestimmten Konstellationen von Satzzeichen wie „Beispiel –“ – Beispiel –.
  • Weitere Beispiele:
    • „St. Ulrich“ – St. Ulrich
    • „Hl. Afra“ – Hl. Afra
    • „Ludwig II.“ – Ludwig II.
    • „Version 3“ – Version 3
    • „14. Jahrhundert“ – 14. Jahrhundert
    • „30. Juni“ – 30. Juni
    • „B 17“ – B 17
    • „S. 18 ff.“ – S. 18 ff.
    • „A 96“ – A 96.

Darstellung auf Computersystemen

Betriebssystem, Applikation
oder Standard1
Geschütztes Leerzeichen ( ) Schmales geschütztes Leerzeichen ( )
Windows GUI (CP1252, Standard) Alt+01602 Alt+82392
TUI (CP850, Eingabeaufforderung) Alt+2552
macOS +Leertaste
X11 unter z. B. Linux oder BSD Compose, Leertaste, Leertaste
AmigaOS Alt+Leertaste
Deutsche Standard-Tastaturbelegung T2
(Standard für Deutschland und Österreich)
Alt Gr+Leertaste Gruppenumschaltung:

sofern vorhanden: , Leertaste
oder Alt Gr+, Leertaste

AbiWord Strg++Leertaste
Emacs Strg+X,8,Leertaste Strg+X,8,Eingabetaste,2,0,2,F,Eingabetaste
Adobe FrameMaker Strg+Leertaste
LibreOffice-Varianten Strg+Leertaste (vor OOo 3)

Strg++Leertaste (ab OOo 3)

Microsoft Word Tastenkombination Strg++Leertaste
Unicode-Eingabe5 A, 0, Alt+C bzw. A, 0, Alt+X 2, 0, 2, F, Alt+C bzw. 2, 0, 2, F, Alt+X
Neo Mod3++Leertaste oder

Mod3+, Leertaste, Leertaste3

Mod3+Mod4+Leertaste4
LaTeX / plain TeX immer ~ \thinspace6 7
zusätzlich mit LaTeX
außerhalb von Formeln
\,8
zusätzlich in Formeln \mkern\thinmuskip9
Konstruktionen allgemein Inhalt von \hbox{…} oder in LaTeX \mbox{…} wird nicht umbrochen, inklusive Leerzeichen;

noch besser ist \nolbreaks{…} aus dem Paket nolbreaks, damit alle Wortzwischenräume einer Zeile übereinstimmen

Konstruktion in Formeln Inhalt von {…} wird nicht umbrochen,10 inklusive Leerzeichen
Vim Digraph11 Strg+K, +NS
Unicode-Eingabe Strg+V, U, 0, 0, A, 0 Strg+V, U, 2, 0, 2, F
WordPerfect Strg+Leertaste
HTML HTML-Entität  
Konstruktion Leerzeichen in Elementen mit CSS-Eigenschaft white-space:nowrap werden nicht umbrochen
XML/XHTML dezimal    
hexadezimal    
ISO 8859-1 (Latin-1) (dezimal) 160
Unicode (hexadezimal) U+00A0 U+202F
1 Viele Betriebssysteme und Applikationen bieten darüber hinaus auch spezifische Möglichkeiten, ein Unicode-Zeichen direkt einzugeben.
2 Zahleneingabe über den Ziffernblock. Alt-Taste währenddessen permanent gedrückt halten.
3 Bei deutscher QWERTZ-Tastaturbelegung entsprechen die Mod3-Tasten der Feststell- bzw. Rautetaste. Die Compose-Unterstützung (Mod3+Tab bzw. ♫) muss bei einigen Systemen nachinstalliert werden.
4 Bei deutscher QWERTZ-Tastaturbelegung entsprechen die Mod3-Tasten der Feststell- bzw. Rautetaste. Die Mod4-Tasten entsprechen der Größer-/Kleiner- (>/<) bzw. Alt-Gr-Taste.
5 Eingeben von Unicode-Zeichen über die Tastatur (Memento vom 16. Dezember 2014 im Internet Archive): In Dialogfeldern ist die Tastenkombination ALT+X
; siehe auch: Das Unicode-Zeichen für den angegebenen Unicode-Zeichencode (hexadezimal), Verwenden der Tastatur zum Einfügen eines Unicode-Zeichencodes in ein Dokument und Einfügen von Unicode-Zeichen.
6 Johannes Braams und andere: The LaTeX 2ε Sources. (PDF, 2,3 MB;) 27. Juni 2011, S. 65.
7 D. E. Knuth: The TeXbook. Addison-Wesley, Reading 1984 und später, S. 352.
8 \, ist im Wesentlichen als \ifmmode\mskip\thinmuskip\else\thinspace\fi definiert, siehe The LaTeX 2ε Sources S. 65. Innerhalb einer Formel wird daraus ein \mskip, was glue erzeugt und daher einen Zeilenumbruch erlaubt – The TeXbook, S. 290 und Kapitel 12. Andernfalls resultiert \thinspace, s. o.
9 The TeXbook S. 280 und 167f. – allerdings völlig unüblich.
10 The TeXbook, S. 173.
11 An RFC 1354 orientierte Digraph-Unterstützung im Einfügemodus gemäß Dokumentation.

Symbol

In Microsoft Word wird als Formatierungssymbol für das Geschützte Leerzeichen das Gradzeichen (°) verwendet.[2]

Siehe auch

Einzelnachweise