Stabilität (Sortierverfahren)
Ein stabiles Sortierverfahren ist ein Sortieralgorithmus, der die Reihenfolge der Datensätze, deren Sortierschlüssel gleich sind, bewahrt.
Wenn bspw. eine Liste alphabetisch sortierter Personendateien nach dem Geburtsdatum neu sortiert wird, dann bleiben unter einem stabilen Sortierverfahren alle Personen mit gleichem Geburtsdatum alphabetisch sortiert.
Will man mit einem instabilen Sortierverfahren, etwa Quicksort, sortieren und dabei die Reihenfolge der Datensätze mit gleichem Schlüssel beibehalten, so kann man sich damit behelfen, dass man die Datensätze um eine Reihenfolgenummer erweitert und diesem Feld den niedrigsten Rang im Sortierschlüssel gibt. Weniger aufwändig ist es aber, ein stabiles Sortierverfahren zu benutzen.
Stabile und instabile Sortierverfahren verhalten sich gleich, wenn die Multimenge der Schlüssel in der Eingabe eine Menge ist, es also keine Duplikate unter den Schlüsseln gibt; ebenso, wenn Datensätze mit gleichem Schlüssel in keiner Weise unterscheidbar sind – beispielsweise, weil der Schlüssel den ganzen Datensatz umfasst. Eine Multimenge von Zahlen oder Namen etwa kann man mit einem stabilen oder instabilen Sortierverfahren sortieren, das Ergebnis ist immer gleich:
Beispiele
Stabiles oder instabiles Sortierverfahren (keine Duplikate):
Carla | Annette |
Annette | Birgit |
Birgit | Carla |
Stabiles oder instabiles Sortierverfahren (nur Schlüssel):
4 | 1 |
3 | 2 |
5 | 3 |
3 | 3 |
2 | 3 |
1 | 4 |
3 | 5 |
Kombiniert man jedoch etwa Namen und Zahlen zu je einem Datensatz und sortiert nur nach einem Teilschlüssel, etwa nach Zahlen, dann existieren bei gleichen Schlüsseln verschiedene Möglichkeiten für die Reihenfolge. Ein stabiles Verfahren behält bei gleichen Schlüsseln die Originalreihenfolge der Namen bei, etwa
Stabiles Sortierverfahren nach Zahlen:
1 Anton | 1 Anton |
4 Karl | 1 Paul |
3 Otto | 3 Otto |
5 Bernd | 3 Helmut |
3 Helmut | 4 Karl |
8 Alfred | 5 Bernd |
1 Paul | 8 Alfred |
Instabiles Sortierverfahren nach Zahlen:
1 Anton | 1 Anton | 1 Paul | 1 Anton | 1 Paul |
4 Karl | 1 Paul | 1 Anton | 1 Paul | 1 Anton |
3 Otto | 3 Otto | 3 Otto | 3 Helmut | 3 Helmut |
5 Bernd | 3 Helmut | 3 Helmut | 3 Otto | 3 Otto |
3 Helmut | 4 Karl | 4 Karl | 4 Karl | 4 Karl |
8 Alfred | 5 Bernd | 5 Bernd | 5 Bernd | 5 Bernd |
1 Paul | 8 Alfred | 8 Alfred | 8 Alfred | 8 Alfred |
Bei instabilem Sortieren kann Paul vor Anton oder Helmut vor Otto zu stehen kommen, also 2 × 2 = 4 Möglichkeiten; darunter ist (wie in der zweiten Spalte gezeigt) auch die Reihenfolge möglich, wie sie ein stabiles Sortieren garantiert erbringen würde.
Anwendung in der Datenverarbeitung
In der Informatik kommen sehr häufig sog. Tabellen vor, d. h. Sequenzen (Ansammlungen, Dateien) von in Felder eingeteilten Datensätzen, bei denen jeder Datensatz für ein Individuum und ein Feld für ein Merkmal dieses Individuums steht. Viele Anwendungsprogramme, z. B. von Datenbanken, und Tabellenkalkulationsprogramme unterstützen die Auswahl von einzelnen Merkmalen („Tabellenspalten“) als Sortierbegriff (Schlüssel).
Ein kombinierter Sortierschlüssel aus zwei Spalten bspw. in der Rangfolge (Dateityp, Dateigröße) führt zum selben Ergebnis wie zwei Sortierungen nach jeweils einer Spalte, und zwar zuerst nach Dateigröße und im zweiten Sortierlauf nach Dateityp. Dabei muss der zweite Sortierlauf die durch den ersten Lauf erzeugte Ordnung im oben erläuterten Sinn erhalten, m. a. W.: der zweite Lauf muss stabil sortieren.
Beispiel: Dateimanager (ähnlich dem Windows-Explorer):
Dateiname | Dateityp | Änderungsdatum | Dateigröße |
---|---|---|---|
a | doc | 1999 | 20 |
u | doc | 2018 | 70 |
k | txt | 2013 | 25 |
c | doc | 2013 | 15 |
r | txt | 1800 | 20 |
Bei den Einzelsortierungen ist nach den niedrigrangigen Schlüsseln (Feldern) zuerst zu sortieren. Eine solche Einzelsortierung kann durch einen Klick für aufsteigend (nach dem Sortierlauf angezeigt als ▴) resp. zwei Klicks für absteigend (▾) auf den Merkmal-Namen in der Titelzeile veranlasst werden.
- Bemerkung
- Wenn der Browser des Benutzers stabil sortiert, dann ist nach einem Klick auf die Spalte Dateityp die Reihenfolge in der Spalte Dateiname: a,u,c,k,r.
Wie viele verschiedene Sortierungen gibt es maximal (bei 4 Spalten und stabilem Sortieren)?
Wenn der Explorer immer stabil sortiert, dann ist eine (einzige) Sortierung nach jeder der
- (Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle !} = Fakultät)
Kombinationen und Reihenfolgen der 4 Felder gleichwertig zu einer passend ausgewählten Abfolge von maximal 4 Sortierungen nach einem einzelnen Feld. Wenn es noch auf die Sortierrichtungen aufsteigend/absteigend ankommt, dann kommen
- Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \binom44\cdot 2^4\cdot 4!+\binom43\cdot 2^3\cdot 3!+\binom42\cdot 2^2\cdot 2!+\binom41\cdot 2^1\cdot 1! = 384+192+48+8 = 632}
Kombinationen zusammen.
Beispiele
Stabile Sortierverfahren:
- Binary Tree Sort
- Bubblesort
- Countingsort
- Cocktailsort
- Gnomesort
- Insertionsort
- Mergesort
- Radixsort
- Shakersort
Instabile Sortierverfahren:
- Bogosort
- Combsort
- Heapsort
- Introsort
- Quicksort
- Selectionsort
- Shellsort
- Smoothsort
- Slowsort
- Stoogesort