Schriftstatistik
Schriftstatistik ist die paralinguistische Disziplin der quantitativen Analyse von Schriftsystemen.
Themen der Schriftstatistik
Anwendungsbezogene Aspekte
Die Schriftstatistik hat eine längere Tradition darin, die Häufigkeiten von Buchstaben und anderen Schriftzeichen in den verschiedenen Sprachen zu erheben. Dabei kann es um rein praktische Zwecke gehen, etwa darum, aufgrund der bekannten Häufigkeit von Buchstaben verschlüsselte Texte zu entziffern (De-Kryptographie). Ein anderer praktischer Ansatz waren Erhebungen zur Häufigkeit von Buchstaben und Buchstabenkombinationen, um eine möglichst sinnvolle, ökonomische Gestaltung von Kurzschriften zu erreichen.[1] Insoweit handelt es sich um ein traditionelles Forschungsgebiet der Sprachstatistik. Hilfreich war die Schriftstatistik auch bei der Gestaltung von optimalen Tastatur-Layouts.
Theoriebezogene Aspekte
Über diese praktischen Zwecke hinaus hat sich die quantitative Linguistik mit Schriftsystemen auseinandergesetzt. So lässt sich zum Beispiel zeigen, dass die Gestaltung von Schriftzeichen und Schriftsystemen gewissen Gesetzmäßigkeiten unterliegt. Bringt man etwa die Buchstaben eines Textes oder eines Textkorpus gemäß ihrer Häufigkeit in eine Rangordnung, so unterliegt diese Rangordnung bestimmten Gesetzen.[2] Dasselbe gilt für die Verwendung von Schriftzeichen, deren Gestaltung sehr unterschiedlich komplex sein kann und deren Verteilung in Texten von dieser Komplexität[3] abhängig ist, wie dies besonders bei chinesischen Schriftzeichen deutlich wird.[4][5][6][7]
Ein weiterer Bereich, in dem sich Gesetzmäßigkeiten aufzeigen lassen, ist die Geschichte der Vermehrung von Schriftzeichen in Sprachen wie dem Chinesischen, das keine Buchstabenschrift, sondern eine weitgehend logographische Schrift verwendet. Die Zunahme der Schriftzeichen, für die Daten von etwa 200 vor Christus bis 1995 vorliegen, folgt einem bekannten Wachstumsgesetz, dem Piotrowski-Gesetz.[8]
Zur Wiedergabe der Phoneme einer Sprache durch Grapheme
Ein in mehrerer Hinsicht wichtiger Aspekt ist die Frage, wie in einer Sprache die Phoneme durch die Grapheme wiedergegeben werden. Unter Graphem werden in diesem Zusammenhang diejenigen Schriftzeichen verstanden, die in einer Sprache geeignet sind, ein bestimmtes Phonem orthographisch wiederzugeben. Im Deutschen kann man zum Beispiel das Phonem /i/ (kurzes i) nur durch das Schriftzeichen < i > („dick“) wiedergeben, das Phonem /o:/ (langes o) dagegen mit den Schriftzeichen/Schriftzeichenkombinationen < o, oo, oh > („Brot, Moor, Sohn“), die gemeinsam sein Graphem darstellen. Im ersten Fall gibt es also nur eine Möglichkeit der orthographischen Realisierung des Phonems /i/, im anderen Fall aber drei Möglichkeiten.
Dies kann man auf das gesamte Phonemsystem einer Sprache anwenden und berechnen, wie sicher sich jemand sein kann, wenn er die Phoneme gemäß den orthographischen Regeln schriftlich wiedergeben will. Im obigen Beispiel ist deutlich, dass die Sicherheit im Fall des Phonems /i/ größer ist als im Fall des Phonems /o:/. Je mehr Schriftzeichen durchschnittlich für die orthographische Realisierung der Phoneme möglich sind, desto höher ist die Unsicherheit, die jemand bewältigen muss, wenn er etwas schriftlich niederlegen will. Diese Unsicherheit ist ein wesentliches Merkmal von Schriftsystemen.
Neben der Unsicherheit lassen sich weitere Kriterien entwickeln: die Graphemgröße (Zahl der Schriftzeichen pro Graphem), die Graphembelastung (Zahl der Grapheme, in denen ein bestimmtes Schriftzeichen vorkommt) und die Nützlichkeit der Schriftzeichen, die als umso größer verstanden wird, je häufiger ein bestimmtes Schriftzeichen in einem Graphem an vorderer Stelle steht. Mit solchen und möglicherweise weiteren Kriterien können ganze Schriftsysteme charakterisiert und miteinander verglichen werden. Vergleicht man das deutsche mit dem schwedischen Schriftsystem, so lässt sich feststellen, dass das schwedische einen geringeren Grad an Unsicherheit aufweist.[9] In einer neueren Untersuchung wurden auf dieser Basis ausführlich Probleme des persischen Schriftsystems untersucht und in Vergleich mit sieben anderen Sprachen gesetzt.[10]
Bisher war nur von vier Kriterien für Schriftsysteme die Rede. Gabriel Altmann hat versucht, einen Regelkreis zu entwickeln, der insgesamt vierzehn solcher Kriterien enthält und ihre Interaktionen modelliert.[11]
Literatur
- Gabriel Altmann, Fan Fengxiang (Hrsg.): Analyses of Script. Properties of Characters and Writing Systems. Mouton de Gruyter, Berlin / New York 2008 (Die Beiträge des Buches geben einen Überblick über Fragestellungen, mit denen die Quantitative Linguistik die Schriftsysteme zu erfassen sucht. Ein Beitrag versucht, die Perspektive einer Schrifttheorie zu eröffnen.).
- Karl-Heinz Best: Zur Häufigkeit von Buchstaben, Leerzeichen und anderen Schriftzeichen in deutschen Texten. In: Glottometrics 11, 2005, Seiten 9–31 (PDF Volltext).
Einzelnachweise
- ↑ Hierher gehört als bekanntestes Werk: Friedrich Wilhelm Kaeding [Hrsg.]: Häufigkeitswörterbuch der deutschen Sprache. Festgestellt durch einen Arbeitsausschuß der deutschen Stenographie-Systeme. Erster Teil: Wort- und Silbenzählungen.Zweiter Teil: Buchstabenzählungen. Selbstverlag des Herausgebers, Steglitz bei Berlin: 1897/98. Teilabdruck in: Beiheft zu Grundlagenstudien aus Kybernetik und Geisteswissenschaften. Bd. 4 / 1963.
- ↑ Archivierte Kopie (Memento des Originals vom 7. April 2015 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.
- ↑ Zur Möglichkeit, die Komplexität von Schriftzeichen zu bestimmen, siehe unter anderem: Gabriel Altmann: Script complexity, in: Glottometrics 8, 2004, S. 68–74 (PDF Volltext); Carsten Peust: Script Complexity Revisited, in: Glottometrics 12, 2006, S. 11–15 (PDF Volltext); Tomi S. Melka, Gabriel Altmann: Script complexity: A Case Study, in: Glottometrics 28, 2014, S. 56–74 (PDF Volltext).
- ↑ Xiaoli Yu: Zur Komplexität chinesischer Schriftzeichen. In: Göttinger Beiträge zur Sprachwissenschaft 5, 2001, Seite 121–129.
- ↑ Hartmut Bohn: Quantitative Untersuchungen der modernen chinesischen Sprache und Schrift. Verlag Dr. Kovač, Hamburg 1998, Seite 52–56, 78–94. ISBN 3-86064-672-9.
- ↑ http://lql.uni-trier.de/index.php/Char_Complexity
- ↑ Panchanan Mohanty, Ioan-Iovitz Popescu, Gabriel Altmann: Script Complexity in Indian Languages. In: Glottometrics 44, 2019, Seite 94–99 (PDF Volltext).
- ↑ Karl-Heinz Best, Jinyang Zhu: Ein Modell für die Zunahme chinesischer Schriftzeichen. In: Glottometrics 20, 2010, Seite 29–33 (PDF Volltext).
- ↑ Karl-Heinz Best, Gabriel Altmann: Some properties of graphemic systems, in: Glottometrics 9, 2005, Seiten 29–39 (PDF Volltext)
- ↑ Tayebeh Mosavi Miangah, Relja Vulanović: The Ambiguity of the Relations between Graphemes and Phonemes in the Persian Orthographic System, in: Glottometrics 50, 2021, Seiten 9–26 (PDF Volltext)
- ↑ Gabriel Altmann: Towards a theory of script. In: Gabriel Altmann, Fan Fengxiang: Analyses of Script. Properties of Characters and Writing Systems. Mouton de Gruyter, Berlin/ New York, 2008, S. 149–164; Regelkreis: S. 160.