Flüsse und Schnitte in Netzwerken

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Flussproblem)

Flüsse und Schnitte in Netzwerken sind Strukturen der Graphentheorie, die vielfältige Anwendungen finden.

Definitionen, wichtige Begriffe und Eigenschaften

Netzwerk

Ein Netzwerk (engl. network) besteht aus einem gerichteten Graphen mit zwei ausgezeichneten Knoten (engl. vertex/vertices), einer Quelle (engl. source) und einer Senke (engl. target) aus , sowie einer Kapazitätsfunktion , die jeder Kante eine nichtnegative Kapazität zuweist, . Hat die Kapazitätsfunktion ausschließlich ganzzahlige Werte, so existiert eine maximale Flussfunktion (siehe folgende Definition), die ebenfalls nur ganzzahlige Werte hat.

Fluss

Ein Fluss ist eine Funktion , die jeder Kante im Netzwerk einen nichtnegativen Flusswert zuweist. Dabei muss folgende Bedingung erfüllt sein:

Kapazitätskonformität:

Der Flusswert auf einer Kante ist höchstens so groß wie die Kapazität der Kante, das heißt, es gilt:

.

Ist zusätzlich die folgende Bedingung erfüllt, heißt der Fluss --Fluss:

Flusserhalt:

Abgesehen von der Quelle s und der Senke t muss in jeden Knoten genau so viel hineinfließen wie herausfließt, das heißt:

Dabei ist

die Menge der in hineinführenden und

die Menge der aus hinausführenden Kanten.

Gilt zudem Flusserhalt auch in und , hat man eine Strömung oder Zirkulation. Man kann zeigen, dass Inzidenzvektoren einer Zirkulation entsprechen, wenn sie im Zyklenraum von liegen.

Exzess

Der Exzess eines Knotens , oder auch Nettofluss oder Überschuss genannt, ist die Differenz der Summe der Flusswerte der eingehenden Kanten und der Summe der Flusswerte der ausgehenden Kanten.

Beispiel für einen Schnitt. Die Kapazität des Schnittes ist

Wert

Der Wert eines --Flusses ist der Überschuss im Knoten oder der Betrag des Überschusses im Knoten .

In Formeln:

, wobei die Quelle des Netzwerkes bezeichnet.

Für alle --Flüsse ist der Überschuss bis auf für alle Knoten Null. Für alle Zirkulationen ist er auch in Null.

Schnitt

Eine echte Teilmenge der Knoten in einem Netzwerk, die , aber nicht enthält, nennt man einen --Schnitt. Oft wird unter einem Schnitt auch die Menge aller Kanten verstanden, die zwischen den Partitionen und verlaufen. Die Kapazität eines Schnittes ist die Summe der Kapazitäten der von nach verlaufenden Kanten.

Schnitte geben eine obere Schranke für den Wert der --Flüsse. Das Max-Flow-Min-Cut-Theorem besagt, dass auch umgekehrt Flusswerte eine Untere Schranke für Schnittkapazitäten sind. Beide Konzepte entsprechen also einander auf eine natürliche Art und Weise.

Ferner entspricht der Fluss im gesamten Netzwerk dem Fluss durch einen beliebigen Schnitt. Zusammen mit der Kapazität des Schnittes gilt daher . Handelt es sich um einen minimalen Schnitt, entspricht der Fluss der Kapazität des Schnittes.[1]

Residualnetzwerk

Das Residualnetzwerk , oder auch Restnetzwerk, zum Fluss mit Residualgraphen und Residualkapazitäten zeigt die restlichen Kapazitäten des Netzwerks an. Der Residualgraph hat dieselbe Knotenmenge wie und besteht aus den von nicht ausgelasteten Kanten ergänzt um Rückkanten: Für jede Kante mit enthält eine Rückkante . Die Residualkapazitäten geben für eine Kante an, um wie viel der Fluss auf ihr noch erhöht werden kann, und für eine Rückkante , um wie viel der Fluss auf der zugehörigen Hinkante verringert werden darf. Also:

, falls

Algorithmische Konstruktion eines Residualnetzwerks

Initialisiere ; ;
1. Für alle Kanten 
2.    if()
3.       Füge  in  ein
4.       Setze 
5.    if()
6.       Füge  in  ein
7.       Setze 
8. gib aus 

Schichtnetzwerk

Der Level eines Knotens ist die Anzahl der Kanten eines kürzesten Weges von nach im Residualnetzwerk zum Fluss . Der -te Level eines Graphen ist die Menge aller Knoten mit Level also . Eine Kante mit Flusswert heißt nützlich von nach , falls . Falls gilt , heißt sie nützlich von nach . Eine Kante heißt nützlich aus einer Menge, falls sie nützlich von einem Element der Menge in ein Element außerhalb der Menge ist. Analog erklärt man nützlich in eine Menge. Das Schichtnetzwerk oder Levelnetzwerk zum Fluss ist ein Teilgraph von mit

Schicht- und Residualnetzwerk können in linearer Laufzeit berechnet werden.

Besondere Wege und Flüsse

Ein x-y-Weg oder Pfad ist eine Folge von Kanten, wobei der Ausgangsknoten jeder Kante der Endknoten ihres Vorgängers ist. Die Länge eines Weges , auch ist die Anzahl der Kanten im Weg.

Die Distanz zwischen und ist die Länge eines kürzesten Weges, falls einer existiert, und „unendlich“, falls nicht. Ein Weg im Residualnetzwerk heißt augmentierender Weg; die Bezeichnungen verbessernder Weg oder erhöhender Weg sind auch gebräuchlich. Jeder --Fluss lässt sich in Flüsse auf --Wegen und auf Kreisen zerlegen. Genau dann, wenn in einem Netzwerk zu einem --Fluss kein augmentierender Weg existiert, hat der Fluss maximalen Wert. Diesen Sachverhalt nutzen der Algorithmus von Ford und Fulkerson und der Algorithmus von Edmonds und Karp aus.

Ein Fluss in einem Netzwerk heißt blockierend, falls in jedem --Weg in eine Kante blockiert, oder auch saturiert, ist, d. h. .

Push-Operation

-> Voraussetzungen:  hat Exzess,  und 
-> Beschreibung: Schiebe 
              Einheiten Fluss von  nach 
1. 
2. 
3. 
4. 
5. 
Lift-Operation

Voraussetzungen:  hat Exzess und es gilt für beliebige :
                  
Beschreibung: inkrementiere die Höhe von 
1. 

Präflüsse

--Präflüsse, oder auch Vorflüsse, (engl. preflow) sind eine Verallgemeinerung von --Flüssen. Dieser Begriff ist nur bei komplexeren (und wesentlich effizienteren) Flussalgorithmen von Bedeutung.

Ein --Präfluss ist eine Funktion mit Kapazitätskonformität wie oben und folgender Abschwächung des Flusserhalts:

Das bedeutet, nur den Knoten darf mehr Fluss verlassen, als ihn erreicht. Ein --Präfluss hat Überschuss in einem Knoten, oder auch Overflow, falls sein Überschuss (wie oben) echt größer als Null ist. Das Residualnetzwerk wird analog zu oben gebildet.

Die Höhenfunktion oder Distanzmarkierung in einem Netzwerk mit --Präfluss ist eine Abbildung mit , und für alle Kanten .

Ferner erklärt man die Operationen Push und Lift algorithmisch, so wie rechts beschrieben. Mit diesen Mitteln kann man Preflow-Push-Algorithmen entwerfen und untersuchen, etwa den Goldberg-Tarjan-Algorithmus (nach Andrew Goldberg und Robert Tarjan). Bei diesen Algorithmen kann man die Datenstrukturen während der Algorithmus läuft nicht als --Fluss interpretieren. Die Methode von Goldberg und Tarjan initialisiert einen Präfluss und terminiert, falls gewisse Manipulationen der Struktur einen --Fluss liefern. Das ist dort stets nach endlich vielen Schritten der Fall und dieser --Fluss ist dann stets maximal.

Algorithmen

Der Algorithmus von Ford und Fulkerson sucht nach und nach augmentierende Wege, also Wege im Residualnetzwerk, und erhöht dort entlang. Dieses Verfahren klappt genau dann, wenn dieser Algorithmus terminiert, also in die Situation kommt, dass es tatsächlich keine augmentierenden Wege mehr gibt. Dann kann man nämlich die maximale von aus im Residualnetz erreichbare Knotenmenge betrachten. Diese definiert einen --Schnitt, dessen Kapazität dem Flusswert gleicht.

Um das Terminieren aber zu sichern, kann man ein Argument über die algebraische Struktur der Kapazitätswerte heranziehen. Sind es nichtnegative ganze Zahlen, ist der Wert eines maximalen --Flusses eine ganze Zahl. Zudem gibt es wenigstens einen maximalen s-t-Fluss, der kantenweise lediglich ganzzahlige Werte annimmt. Für jeden maximalen s-t-Fluss muss das nicht der Fall sein. Weil jedes Augmentieren entlang eines --Weges den Wert des --Flusses um einen ganzzahligen Schritt, also um mindestens 1 erhöht, ist die Terminierung nach endlich vielen Schritten in dem Fall gesichert. Eine obere Schranke der Laufzeit des Algorithmus kann dann von den Werten der Kapazitäten abhängen. Die Laufzeit kann dann in Bezug auf Anzahl der Knoten und Kanten beliebig groß sein, je nachdem welche Kapazitäten auf den Kanten gegeben sind. Sind die Kapazitäten nichtnegative rationale Zahlen, terminiert der Ford-Fulkerson-Algorithmus ebenfalls, weil das Netzwerk dann algorithmisch äquivalent zu einem Netzwerk ist, bei dem die Kapazitäten mit dem Hauptnenner multipliziert sind, also nur ganzzahlige Kapazitäten auftreten. Bei reellen, irrationalen Kapazitäten muss der Algorithmus jedoch nicht terminieren und noch nicht einmal gegen einen maximalen --Fluss konvergieren.

Der Edmonds-Karp-Algorithmus stellt eine Weiterentwicklung der Methode von Ford und Fulkerson dar: Er funktioniert ganz analog, sucht aber augmentierende Wege, die bezüglich Kantenanzahl minimal sind. Das geht mit einer Breitensuche jeweils in linearer Laufzeit. Der Edmonds-Karp-Algorithmus terminiert auch bei beliebigen reellen Kantenkapazitäten. Darüber hinaus ist seine Laufzeit , also im Allgemeinen größenordnungsmäßig deutlich besser als der Ford-Fulkerson-Algorithmus.

Der Dinic-Algorithmus basiert auf einer weiteren Beobachtung. Sucht man im Residualnetzwerk nach einem augmentierenden Weg, kann es passieren, dass man in Sackgassen gerät, also zu einem Knoten, von dem aus gar nicht erreichbar ist. Die Idee ist, das Netzwerk zu schichten, also in Gruppen zusammenzufassen, die dieselbe Entfernung zu haben, also solche Sackgassen eliminiert sind. In diesem Schichtnetzwerken nutzt man dann ferner aus, dass eine Suche nicht nur einen Weg liefert, sondern immer auch ohne zusätzlichen Aufwand einen Wegbaum. Entlang dieses Baumes kann man dann Fluss schicken und das Netzwerk blockieren. Das geht alles elementar in mit einer modifizierten Tiefensuche. In der nächsten Iteration hat man dann die Situation, wenigstens eine Schicht mehr zu benötigen, weil die alte Schichtung blockiert ist. Das Argument zur Beschränkung der Schichtzahl auf höchstens Stück liefert eine Schranke an die Anzahl der sogenannten Phasendurchläufe des Algorithmus, also die Anzahl der Schleifeniterationen. Somit ergibt sich eine Laufzeit von .

Die folgende Tabelle gibt eine Übersicht der entwickelten Fluss-Algorithmen und ihrer Laufzeiten:

Max-Flow Algorithmen nach Veröffentlichung

Formulierungen als lineares Programm

Das Problem, den Flusswert zu maximieren, lässt sich ebenfalls als lineares Optimierungsproblem beschreiben. Wählt man beispielsweise eine Variable für jede Kante , welche den Fluss auf der Kante misst, so ergibt sich das folgende Programm:

Eine alternative Formulierung erhält man, wenn man für jeden --Pfad eine Variable einführt, welche den Fluss auf dem entsprechenden Pfad bezeichnet. Es ergibt sich daraus das folgende Programm:

Dabei bezeichnet die Menge aller Pfade von nach .

Die zweite Formulierung erscheint zunächst ungünstig, da die Anzahl der --Pfade im Allgemeinen exponentiell mit der Anzahl der Knoten und Kanten wächst. Trotzdem kann diese Formulierung durch Spaltengenerierung effizient, also in Polynomialzeit gelöst werden.

Die beiden Formulierungen haben zusätzlich die Eigenschaft, dass die Matrizen, welche die Nebenbedingungen beschreiben, total unimodular sind. Damit ist jede Optimallösung der beiden Programme ganzzahlig, sofern die Kapazitäten ganzzahlig sind.

Es ist zudem lehrreich, sich die Dualisierungen der obigen Programme anzusehen. Für die pfadbasierte Formulierung ist das duale Programm beispielsweise gegeben durch:

Das duale Programm ist ebenfalls total unimodular. Dies impliziert, dass die Optimallösung des dualen Programms ein -Vektor mit Einträgen ist. Für jeden zulässigen -Vektor entspricht außerdem die Menge einem --Schnitt. Damit entspricht die Optimallösung des dualen Programms einem --Schnitt minimaler Kapazität. Hieraus folgt durch den starken Dualitätssatz der linearen Optimierung das Max-Flow-Min-Cut-Theorem.

Verallgemeinerungen

Zu dem Problem gibt es einige wesentliche Verallgemeinerungen. Als erstes kann man anstelle von Flüssen zwischen einer Quelle beziehungsweise Senke solche zwischen Gebieten betrachten. Dazu gibt man sich eine gewisse Menge von Versorgern und eine Menge von Empfängern vor, sowie einen Graphen und Kapazitäten. Das Problem ist nicht schwerer als Max-Flow und kann entweder durch Vor- und Nachschalten von Zusatzknoten oder durch Übergang zum Quotientengraphen auf Max-Flow reduziert werden.

Andererseits kann man die Gültigkeit der den Kanten zugewiesenen Kapazitäten auf eine gewisse Umgebung der Kante ausweiten, wobei für ein festgehaltenes eine -Umgebung die Menge von Knoten und Kanten ist, die Elemente von der Kante entfernt liegen. Der Spezialfall entspricht gerade dem maximalen Flussproblem. Der Fall entspricht dem maximalen Flussproblem mit Knotenkapazitäten. Das kann auf Max-Flow reduziert werden, indem die Knoten durch ein Gebilde, wie im Bild ersetzt werden. Dabei wird die Kantenzahl nicht konstant verändert, also die Komplexität des Problems erhöht. Es existieren aber Lösungen für Max-Flow, deren Komplexität streng von den Knoten abhängt, deren Zahl sich höchstens um den konstanten Faktor 2 ändert.

Für den Fall kann man beweisen, dass das Problem NP-vollständig ist und daher vermutlich nicht in polynomieller Zeit lösbar ist (es sei denn ). Für den Fall wurde ein polynomieller Algorithmus gefunden.

Anwendung

Praktische Anwendungen

Diese letzte Verallgemeinerung ist motiviert durch Probleme bei der Verkabelung von VLSI-Chips, wo es aufwändig ist, in eine gewisse Nähe von gelegten Kabeln weitere zu setzen.

Die Flusstheorie hat sich historisch ausgehend von Problemen aus der Anwendung entwickelt. Allgemein ist man von der Situation ausgegangen, ein Fluid, also ein beliebig in Untergegenstände zerlegbaren Gegenstand, auf verschiedenen Wegen durch eine Welt räumlich zu verlagern – etwa elektrische Energie über ein Stromnetzwerk von einer Quelle an einen Bedarfsort, oder Daten durch ein Datennetzwerk von einem Sender zu einem Empfänger. Auch abstrakte Gegenstände wie „einander kennen“ kann man modellieren. Durch maximale Flüsse in einem sozialen Netzwerk kann man dann ein Maß dafür erhalten, wie stark zwei (Mengen von) Personen miteinander vernetzt sind.

Bipartiter Graph mit der Knotenmenge A (rot) und B (grün) und der ergänzten Quelle s und Senke t

Theoretische Anwendungen

Eine naheliegende und natürliche Anwendung hat die Flusstheorie bei der Transversalentheorie, die sich auf sehr natürliche Art und Weise in die Theorie der Flüsse einbetten lässt. Einen umfassenden Ansatz, das zu tun, hat Ford 1962 in einem Standardwerk formuliert.

Auch viele kombinatorische Probleme auf Graphen, wie bipartite Matchings, lassen sich leicht in ein geeignetes Flussproblem überführen (siehe Bild) und dort schnell lösen. Eine weitere Anwendung ist das effiziente Ermitteln der Knotenzusammenhangszahl, Kantenzusammenhangszahl oder Bogenzusammenhangszahl. Durch das Lemma von Tutte (nach William Thomas Tutte) werden zudem Anwendungen erweiterter Flusstheorie (sogenannten gruppenwertigen Flüssen) und Färbbarkeitsaussagen deutlich. Einige Vermutungen von ihm zur Existenz von k-Flüssen in planaren Graphen hätten starke theoretische Implikationen.

Literatur