Zwei-Personen-Nullsummenspiel

Ein Zwei-Personen-Nullsummenspiel ist in der Spieltheorie ein Nullsummenspiel mit zwei Spielern. Nullsummenspiele sind dadurch gekennzeichnet, dass die Verluste der Verlierer genau den Gewinnen der Sieger entsprechen.[1] Die meisten gängigen Spiele um Geld, wie Skat, Poker usw., sind Beispiele hierfür. Sind an einem Nullsummenspiel nur zwei Spieler beteiligt, so entfallen auch alle Möglichkeiten für kooperatives Verhalten auf Kosten Dritter. Aus diesem Grund stellen Zwei-Personen-Nullsummenspiele ein gut überblickbares Modell für spieltheoretische Strategie- und Gleichgewichtskonzepte dar, das schon seit Beginn der Spieltheorie regelmäßig untersucht wurde. Als Besonderheit fallen hier die Begriffe Nash-Gleichgewicht, Gleichgewicht in Maximin-Strategien und Gleichgewicht in Minimax-Strategien zusammen.

Die Begriffe Maximin- und Minimax-Strategie werden in der Literatur allerdings nicht einheitlich verwendet, es sollte immer angegeben werden, welches inhaltliche Konzept damit verbunden ist: Strategie schlimmstmöglicher Bestrafung des Gegners (in diesem Artikel Minimax) oder Maximierung des ungünstigsten Ergebnisses (in diesem Artikel Maximin).

Der Artikel definiert die grundlegenden Begriffe und behandelt die zwei zentralen Sätze für die Bestimmung der Gleichgewichte. Die Konzepte werden anhand der Beispiele „Matching Pennies“ und „Schere, Stein, Papier“ erläutert.

Definitionen

Spiel in Normalform

Um ein Spiel in Normalform (Spieltheorie) zu beschreiben, legt man fest, welche Spieler am Spiel beteiligt sind; man bezeichnet dies als die Spielermenge I {\displaystyle \textstyle I} . Jedem Spieler i I {\displaystyle i\in I} wird eine Strategiemenge S i {\displaystyle S_{i}} zugeordnet. Die Strategiemenge S i {\displaystyle S_{i}} enthält alle Strategien, aus denen Spieler i {\displaystyle i} bei Durchführung des Spiels eine Strategie s i {\displaystyle s_{i}} auswählt. Schließlich gibt es für jeden Spieler i I {\displaystyle i\in I} eine Auszahlungsfunktion u i {\displaystyle u_{i}} , die jeder Strategiekombination ( s j ) j I {\displaystyle (s_{j})_{j\in I}} eine Auszahlung für Spieler i {\displaystyle i} zuordnet.

Definition: Unter einem Spiel Γ {\displaystyle \Gamma } in Normalform versteht man ein Tripel ( I , ( S i ) i I , ( u i ) i I ) {\displaystyle (I,(S_{i})_{i\in I},(u_{i})_{i\in I})} [2], wobei u i : j I S j R {\displaystyle \textstyle u_{i}:\prod _{j\in I}S_{j}\rightarrow \mathbb {R} } .

Konstantsummenspiel

Bei einem Konstantsummenspiel wird bei jeder Strategiekombination, also jedem Spielergebnis die gleiche Auszahlungssumme C {\displaystyle C} an alle Spieler ausgeschüttet.

Definition: Ein Spiel Γ = ( I , ( S i ) i I , ( u i ) i I ) {\displaystyle \Gamma =(I,(S_{i})_{i\in I},(u_{i})_{i\in I})} heißt Konstantsummenspiel mit Auszahlungssumme C {\displaystyle C} , wenn gilt: i I u i = C {\displaystyle \textstyle \sum _{i\in I}u_{i}=C} .

Konstantsummenspiele ergeben sich insbesondere, wenn ein fester Ressourcenbestand oder ein fester Geldbetrag unter den Spielern als Spielergebnis aufgeteilt wird.

Nullsummenspiel

Definition: Ein Konstantsummenspiel mit Auszahlungssumme C {\displaystyle C} heißt Nullsummenspiel, wenn: C = 0 {\displaystyle \textstyle C=0} .

Spieltheoretisch besteht kein wesentlicher Unterschied zwischen Konstantsummen- und Nullsummenspielen: Aus einem Konstantsummenspiel Γ {\displaystyle \Gamma } mit Auszahlung C {\displaystyle C} entsteht ein äquivalentes Nullsummenspiel Γ ~ {\displaystyle {\tilde {\Gamma }}} , indem man einem beliebigen Spieler i {\displaystyle i} vor Spielbeginn den Betrag C {\displaystyle C} zuordnet, den er nach Spielende sicher verliert und somit u ~ i := u i C {\displaystyle {\tilde {u}}_{i}:=u_{i}-C} erhält. Die Auszahlungen im Spiel Γ ~ {\displaystyle {\tilde {\Gamma }}} summieren sich dann zu 0. Aus diesem Grund kann man sagen, dass die Gewinne der Sieger den Verlusten der Unterlegenen entsprechen.

Zwei-Personen-Nullsummenspiel

Definition: Ein Nullsummenspiel ( I , ( S i ) i I , ( u i ) i I ) {\displaystyle (I,(S_{i})_{i\in I},(u_{i})_{i\in I})} heißt Zwei-Personen-Nullsummenspiel, wenn: | I | = 2 {\displaystyle |I|=2} .

Bei Zwei-Personen-Nullsummenspielen ist die Auszahlung des zweiten Spielers bereits vollständig durch die Auszahlung des ersten Spielers festgelegt: Bezeichnet man die beiden Spieler mit 1 {\displaystyle 1} und 2 {\displaystyle 2} , also I = { 1 , 2 } {\displaystyle I=\{1,2\}} , so gilt u 2 ( s 1 , s 2 ) = u 1 ( s 1 , s 2 ) {\displaystyle u_{2}(s_{1},s_{2})=-u_{1}(s_{1},s_{2})} .

Es ist daher möglich, die Definition eines Zwei-Personen-Nullsummenspiels zu vereinfachen:

Definition: Ein Zwei-Personen-Nullsummenspiel ist ein Tripel ( S 1 , S 2 , u ) {\displaystyle (S_{1},S_{2},u)} , wobei u : S 1 × S 2 R {\displaystyle u:S_{1}\times S_{2}\rightarrow \mathbb {R} } .[3]

Die Spielermenge I {\displaystyle \textstyle I} ist hierbei natürlicherweise I = { 1 , 2 } {\displaystyle I=\{1,2\}} ; die Auszahlungsfunktion u {\displaystyle u} bezieht sich auf Spieler 1, Spieler 2 hat dann die Auszahlungsfunktion u 2 := u {\displaystyle u_{2}:=-u} .

Beispiele

Zwei-Personen-Nullsummenspiele, bei denen jeder Spieler nur endlich viele Strategien hat, werden gerne in Form einer Bimatrix oder vereinfacht als Matrix dargestellt. Dabei entspricht jede Zeile einer Strategie s 1 {\displaystyle s_{1}} für Spieler 1, also einem Element aus S 1 {\displaystyle S_{1}} , jede Spalte entsprechend einer Strategie s 2 {\displaystyle s_{2}} für Spieler 2. In den Feldern der Bimatrix stehen die Auszahlungen u 1 ( s 1 , s 2 ) {\displaystyle u_{1}(s_{1},s_{2})} und u 2 ( s 1 , s 2 ) {\displaystyle u_{2}(s_{1},s_{2})} . Die Bimatrix stellt also eine Wertetabelle der Funktionen u 1 {\displaystyle u_{1}} und u 2 {\displaystyle u_{2}} gemäß der ersten Definition eines Zwei-Personen-Nullsummenspiels dar.

Da die Auszahlung von Spieler 2 aber durch die Auszahlung von Spieler 1 bereits eindeutig festgelegt ist, genügt eigentlich die Angabe der Auszahlung für Spieler 1; dies führt zur Matrixdarstellung gemäß der 2. Definition. Die Matrix ist dann eine Wertetabelle für die Funktion u {\displaystyle u} .

Γ {\displaystyle \Gamma } als Bimatrix
s 2 1 {\displaystyle s_{2}^{1}} {\displaystyle \cdots } s 2 n {\displaystyle s_{2}^{n}}
s 1 1 {\displaystyle s_{1}^{1}} u 1 ( s 1 1 , s 2 1 ) {\displaystyle u_{1}(s_{1}^{1},s_{2}^{1})} , u 2 ( s 1 1 , s 2 1 ) {\displaystyle u_{2}(s_{1}^{1},s_{2}^{1})} {\displaystyle \cdots } u 1 ( s 1 1 , s 2 n ) {\displaystyle u_{1}(s_{1}^{1},s_{2}^{n})} , u 2 ( s 1 1 , s 2 n ) {\displaystyle u_{2}(s_{1}^{1},s_{2}^{n})}
{\displaystyle \vdots } {\displaystyle \vdots } {\displaystyle \ddots } {\displaystyle \vdots }
s 1 m {\displaystyle s_{1}^{m}} u 1 ( s 1 m , s 2 1 ) {\displaystyle u_{1}(s_{1}^{m},s_{2}^{1})} , u 2 ( s 1 m , s 2 1 ) {\displaystyle u_{2}(s_{1}^{m},s_{2}^{1})} {\displaystyle \cdots } u 1 ( s 1 m , s 2 n ) {\displaystyle u_{1}(s_{1}^{m},s_{2}^{n})} , u 2 ( s 1 m , s 2 n ) {\displaystyle u_{2}(s_{1}^{m},s_{2}^{n})}

In der vereinfachten Darstellung erhält man dann:

Γ s 2 1 s 2 n s 1 1 u ( s 1 1 , s 2 1 ) u ( s 1 1 , s 2 n ) s 1 m u ( s 1 m , s 2 1 ) u ( s 1 m , s 2 n ) {\displaystyle {\begin{array}{c|ccc}\Gamma &s_{2}^{1}&\cdots &s_{2}^{n}\\\hline s_{1}^{1}&u_{(}s_{1}^{1},s_{2}^{1})&\cdots &u_{(}s_{1}^{1},s_{2}^{n})\\\vdots &\vdots &\ddots &\vdots \\s_{1}^{m}&u_{(}s_{1}^{m},s_{2}^{1})&\cdots &u_{(}s_{1}^{m},s_{2}^{n})\end{array}}}

Als Matrix des Spiels bezeichnet man dann die m × n {\displaystyle m\times n} -Matrix A:

A = ( u ( s 1 1 , s 2 1 ) u ( s 1 1 , s 2 n ) u ( s 1 m , s 2 1 ) u ( s 1 m , s 2 n ) ) {\displaystyle A=\left({\begin{array}{ccc}u(s_{1}^{1},s_{2}^{1})&\cdots &u(s_{1}^{1},s_{2}^{n})\\\vdots &\ddots &\vdots \\u(s_{1}^{m},s_{2}^{1})&\cdots &u(s_{1}^{m},s_{2}^{n})\end{array}}\right)}

Matching Pennies (A)

In der Spieltheorie wird häufig Matching-Pennies als Nullsummenspiel betrachtet: Zwei Spieler legen gleichzeitig eine Münze auf den Tisch. Liegt bei beiden Münzen Kopf (K) oder bei beiden Münzen Zahl (Z) oben, so gehören die beiden Münzen Spieler 1; zeigen die beiden Münzen verschiedene Seiten, so gehören die beiden Münzen Spieler 2. Da der Sieger also die Münze des Verlierers gewinnt, handelt es sich um ein Nullsummenspiel. Als Bimatrix ergibt sich folgende Darstellung:

Auszahlungsmatrix für Spieler 1 und Spieler 2
Kopf Zahl
Kopf 1 , −1 −1, 1
Zahl −1 , 1 1 , −1

In der vereinfachten Darstellung erhält man folgende Matrix:

K Z K 1 1 Z 1 1 also die Matrix A = ( 1 1 1 1 ) {\displaystyle {\begin{array}{c|rr}&K&Z\\\hline K&1&-1\\Z&-1&1\end{array}}\quad {\text{also die Matrix}}\quad A=\left({\begin{array}{rr}1&-1\\-1&1\end{array}}\right)}

Siehe auch: Abschnitt 'Beispiel: Kopf oder Zahl (Matching Pennies)' im Artikel 'Unberechenbarkeit (Spieltheorie)'

Schere, Stein, Papier (B)

In Deutschland verbreiteter ist „Schere, Stein, Papier“. Die Strategien in diesem Spiel heißen wie der Name des Spiels. Man verbindet damit die Vorstellung, dass die Schere (S) kaputt geht, wenn man versucht, mit ihr einen Stein (St) zu zerschneiden, wohingegen die Schere das Papier (P) problemlos in Stücke schneidet. Mit dem Papier kann man den Stein einwickeln. Daraus ergibt sich, dass Schere gegen Papier, Papier gegen Stein und Stein gegen Schere gewinnt. Bei gleicher Strategie beider Spieler kommt es zu einem Unentschieden. Für die spieltheoretische Behandlung wird meistens Sieg mit einem Punktgewinn, Unentschieden mit 0 und Niederlage mit einem Punktverlust gewertet.

Die Strategiemengen der Spieler lauten also S 1 = S 2 = { S , S t , P } {\displaystyle S_{1}=S_{2}=\{S,St,P\}} . Die Menge aller möglichen Strategiekombinationen (Kartesisches Produkt) ist dann:

S 1 × S 2 = { ( S , S ) , ( S , S t ) , ( S , P ) , ( S t , S ) , ( S t , S t ) , ( S t , P ) , ( P , S ) , ( P , S t ) , ( P , P ) } {\displaystyle S_{1}\times S_{2}=\{(S,S),(S,St),(S,P),(St,S),(St,St),(St,P),(P,S),(P,St),(P,P)\}} .

In Form einer Bimatrix[4] sieht das Spiel dann folgendermaßen aus:

Auszahlungsmatrix für Spieler 1 und Spieler 2
Schere Stein Papier
Schere 0, 0 -1, 1 1, -1
Stein 1, -1 0, 0 -1, 1
Papier -1, 1 1, -1 0, 0

In der vereinfachten Matrixdarstellung sieht „Schere, Stein, Papier“ dann so aus:

S S t P S 0 1 1 S t 1 0 1 P 1 1 0 also die Matrix B = ( 0 1 1 1 0 1 1 1 0 ) {\displaystyle {\begin{array}{c|rrr}&S&St&P\\\hline S&0&-1&1\\St&1&0&-1\\P&-1&1&0\end{array}}\quad {\text{also die Matrix}}\quad B=\left({\begin{array}{rrr}0&-1&1\\1&0&-1\\-1&1&0\end{array}}\right)}

Weitere Beispiele (C), (D)

Für die weitere Diskussion sollen noch die folgenden beiden Spiele (C) und (D) eingeführt werden. Bei Beispiel (C) sehen wir ein Nullsummenspiel, das ein Nash-Gleichgewicht in reinen Strategien enthält, welches in der Rubrik Lösungskonzepte gelöst wird. (D) ist das Spiel Matching Pennies, bei dem gemischte Strategien gewählt werden können.

Auch Spiel (C) wird zunächst als Bimatrix und dann als Matrix angegeben.

Auszahlungsmatrix für Spieler 1 und Spieler 2
Links Mitte Rechts
Oben −2, 2 0, 0 −3, 3
Unten 3, −3 2, −2 4, −4

l m r o 2 0 3 u 3 2 4 also C = ( 2 0 3 3 2 4 ) {\displaystyle {\begin{array}{c|rrr}&l&m&r\\\hline o&-2&0&-3\\u&3&2&4\end{array}}\quad {\text{also}}\quad C=\left({\begin{array}{rrr}-2&0&-3\\3&2&4\end{array}}\right)}

Das Beispiel (D) zeigt ein Spiel, bei dem die Strategiemengen der Spieler nicht endlich sind; es handelt sich hier bei den Strategiemengen der Spieler um das Einheitsintervall [ 0 , 1 ] {\displaystyle [0,1]} , also ein Kontinuum.

(D) Γ = ( S 1 , S 2 , u ) {\displaystyle \Gamma =(S_{1},S_{2},u)} mit S 1 = S 2 = [ 0 , 1 ] {\displaystyle S_{1}=S_{2}=[0,1]} und u : [ 0 , 1 ] × [ 0 , 1 ] R , u ( s 1 , s 2 ) = ( 2 s 1 1 ) ( 2 s 2 1 ) {\displaystyle u:[0,1]\times [0,1]\rightarrow \mathbb {R} ,u(s_{1},s_{2})=(2s_{1}-1)(2s_{2}-1)} .

Gleichgewichtskonzepte

Die Gleichgewichtskonzepte werden hier nur für Zwei-Personen-Nullsummenspiele definiert.

Nash-Gleichgewicht

Ein zentraler Begriff der Spieltheorie ist die beste Reaktion eines Spielers auf eine gegnerische Strategiekombination. Im 2-Personen-Spiel ist dies die Antwort auf die Frage, mit welcher Strategie ein Spieler seine Auszahlung maximiert, wenn die gegnerische Strategie vorgegeben ist. Die Reaktionsfunktion oder auch Reaktionskorrespondenz eines Spielers gibt also für jede gegnerische Strategie an, was die beste strategische Antwort darauf ist; der Begriff Reaktionskorrespondenz ist die Menge aller besten Antworten auf die gegnerische Strategie.

Definition: Die Reaktionskorrespondenz R 1 ( s 2 ) {\displaystyle R_{1}(s_{2})} von Spieler 1 auf Spieler 2 ist die mengenwertige Funktion R 1 ( s 2 ) = argmax s 1 S 1 u 1 ( s 1 , s 2 ) {\displaystyle R_{1}(s_{2})={\text{argmax}}_{s_{1}\in S_{1}}\;u_{1}(s_{1},s_{2})} .

Man beachte, dass bei der vereinfachten Darstellung in der Definition einer besten Reaktion für Spieler 2 minimiert statt maximiert wird:

Definition: Die Reaktionskorrespondenz R 2 ( s 1 ) {\displaystyle R_{2}(s_{1})} von Spieler 2 auf Spieler 1 ist die mengenwertige Funktion R 2 ( s 1 ) = argmin s 2 S 2 u ( s 1 , s 2 ) {\displaystyle R_{2}(s_{1})={\text{argmin}}_{s_{2}\in S_{2}}\;u(s_{1},s_{2})} .

Unter einem Nash-Gleichgewicht versteht man eine Strategienkombination, bei der jeder Spieler seine Auszahlung für die gegebene Strategie des Gegners maximiert, also jeder Spieler eine beste Reaktion auf den Gegner spielt. Für ein Zwei-Personen-Nullsummenspiel in Normalform bedeutet dies folgendes:

Definition: Die Strategiekombination ( s 1 , s 2 ) {\displaystyle (s_{1}^{*},s_{2}^{*})} ist ein Nash-Gleichgewicht, wenn gilt: s 1 argmax s 1 S 1 u 1 ( s 1 , s 2 ) und s 2 argmax s 2 S 2 u 2 ( s 1 , s 2 ) {\displaystyle s_{1}^{*}\in {\text{argmax}}_{s_{1}\in S_{1}}\quad \!\!\!u_{1}(s_{1},s_{2}^{*})\quad {\text{und}}\quad s_{2}^{*}\in {\text{argmax}}_{s_{2}\in S_{2}}\quad \!\!\!u_{2}(s_{1}^{*},s_{2})} .

Die Definition verändert sich für die vereinfachte Darstellung ( S 1 , S 2 , u ) {\displaystyle (S_{1},S_{2},u)} zu:

Definition: Die Strategiekombination ( s 1 , s 2 ) {\displaystyle (s_{1}^{*},s_{2}^{*})} ist ein Nash-Gleichgewicht, wenn gilt: s 1 argmax s 1 S 1 u ( s 1 , s 2 ) und s 2 argmin s 2 S 2 u ( s 1 , s 2 ) {\displaystyle s_{1}^{*}\in {\text{argmax}}_{s_{1}\in S_{1}}\quad \!\!\!u(s_{1},s_{2}^{*})\quad {\text{und}}\quad s_{2}^{*}\in {\text{argmin}}_{s_{2}\in S_{2}}\quad \!\!\!u(s_{1}^{*},s_{2})} .

Minimax

Man kann auch unterstellen, dass die Spieler im Wesentlichen daran interessiert sind, den Gewinn ihres Gegners möglichst gering zu halten. Für Spieler 1 bedeutet dies, dass er eine Strategie mit folgender Definition wählt:

Definition: Die Strategie s 1 {\displaystyle s_{1}^{*}} ist eine Minimax-Strategie für Spieler 1, wenn gilt: s 1 argmin s 1 S 1 max s 2 S 2 u 2 ( s 1 , s 2 ) {\displaystyle \textstyle s_{1}^{*}\in {\text{argmin}}_{s_{1}\in S_{1}}\max _{s_{2}\in S_{2}}\quad \!\!\!u_{2}(s_{1},s_{2})} .

In der vereinfachten Darstellung ( S 1 , S 2 , u ) {\displaystyle (S_{1},S_{2},u)} wird daraus:

Definition: Die Strategie s 1 {\displaystyle s_{1}^{*}} ist eine Minimax-Strategie für Spieler 1, wenn gilt: s 1 argmax s 1 S 1 min s 2 S 2 u ( s 1 , s 2 ) {\displaystyle \textstyle s_{1}^{*}\in {\text{argmax}}_{s_{1}\in S_{1}}\min _{s_{2}\in S_{2}}\quad \!\!\!u(s_{1},s_{2})} .

Dies erklärt, warum die Begriffe Minimax- und Maximin-Strategie (Min-Max-Theorem) in der Literatur nicht einheitlich verwendet werden.

Eine Minimax-Strategie im Sinne der hier gegebenen Definition wird auch als Strategie schlimmstmöglicher Bestrafung bezeichnet. Spieler 1 kann also durch eine Minimax-Strategie sicherstellen, dass Spieler 2 höchstens max s 1 S 1 min s 2 S 2 u ( s 1 , s 2 ) {\displaystyle \textstyle -\max _{s_{1}\in S_{1}}\min _{s_{2}\in S_{2}}\quad \!\!\!u(s_{1},s_{2})} erhält. Da es sich um ein Nullsummenspiel handelt, bedeutet dies, dass Spieler 1 also mindestens V 1 = max s 1 S 1 min s 2 S 2 u ( s 1 , s 2 ) {\displaystyle \textstyle V_{1}=\max _{s_{1}\in S_{1}}\min _{s_{2}\in S_{2}}\quad \!\!\!u(s_{1},s_{2})} gewinnt.

Für Spieler 2 gilt bei Anwendung einer Minimax-Strategie, dass er mit einer Minimax-Strategie den Gewinn von Spieler 1 auf V 2 = min s 2 S 2 max s 1 S 1 u ( s 1 , s 2 ) {\displaystyle \textstyle V_{2}=\min _{s_{2}\in S_{2}}\max _{s_{1}\in S_{1}}\quad \!\!\!u(s_{1},s_{2})} beschränken kann. Es gilt also V 1 V 2 {\displaystyle V_{1}\leq V_{2}} .[5] Falls V 1 = V 2 {\displaystyle V_{1}=V_{2}} gilt, so spricht man von einem Gleichgewicht in Minimax-Strategien.

Maximin

Sind die Spieler sehr pessimistisch, so gehen sie davon aus, dass es bei jeder Strategie, die sie wählen, zum für sie ungünstigsten Ergebnis kommt. Sie sollten dann versuchen dieses Minimalergebnis zu optimieren. Dies führt zu folgender Definition:

Definition: Die Strategie s 1 {\displaystyle s_{1}^{*}} ist eine Maximin-Strategie für Spieler 1, wenn gilt: s 1 argmax s 1 S 1 min s 2 S 2 u 1 ( s 1 , s 2 ) {\displaystyle \textstyle s_{1}^{*}\in {\text{argmax}}_{s_{1}\in S_{1}}\min _{s_{2}\in S_{2}}\quad \!\!\!u_{1}(s_{1},s_{2})} .

In der vereinfachten Darstellung ( S 1 , S 2 , u ) {\displaystyle (S_{1},S_{2},u)} wird daraus:

Definition: Die Strategie s 1 {\displaystyle s_{1}^{*}} ist eine Maximin-Strategie für Spieler 1, wenn gilt: s 1 argmax s 1 S 1 min s 2 S 2 u ( s 1 , s 2 ) {\displaystyle \textstyle s_{1}^{*}\in {\text{argmax}}_{s_{1}\in S_{1}}\min _{s_{2}\in S_{2}}\quad \!\!\!u(s_{1},s_{2})} .

Vergleicht man die zweite Definitionsvariante mit der Definition einer Minimax-Strategie, so erkennt man, dass bei Zwei-Personen-Nullsummenspielen kein Unterschied besteht.

Die Definitionen von V 1 {\displaystyle V_{1}} , V 2 {\displaystyle V_{2}} und der Gleichgewichtsbegriff übertragen sich ebenfalls und stimmen mit den unter Minimax eingeführten Begriffen überein; von einem Gleichgewicht in Maximin-Strategien spricht man also nur, falls V := V 1 = V 2 {\displaystyle V:=V_{1}=V_{2}} . Wenn ein Gleichgewicht vorliegt, so bezeichnet man mit V := V 1 = V 2 {\displaystyle V:=V_{1}=V_{2}} den Wert des Spiels. V {\displaystyle V} ist der Gewinn für Spieler 1 und der Verlust für Spieler 2, wenn sie das Spiel durchführen; die Bezeichnung Wert des Spiels bezieht sich auf die Sicht von Spieler 1.

Allgemein nennt man V 1 {\displaystyle V_{1}} unteren Spielwert und V 2 {\displaystyle V_{2}} oberen Spielwert des Spiels.[6]

Die Tatsache, dass bei Zwei-Personen-Nullsummenspielen kein Unterschied zwischen Minimax- und Maximin-Strategien besteht, verbunden mit der Tatsache, dass einige Autoren die Reihenfolge der Anwendung der Optimierungsoperatoren, andere Autoren jedoch die Reihenfolge im Schriftbild für maßgeblich halten, und nicht zuletzt, dass statt einer Gewinnauszahlung auch gerne eine Verlustfunktion als Spielergebnis verwendet wird, führt dazu, dass man sich auf die Bedeutung der Begriffe Minimax und Maximin nicht verlassen kann. Entscheidend ist vielmehr, ob die Strategiewahl auf der schlimmstmöglichen Bestrafung des Gegners, oder auf der Minimierung des eigenen Maximalverlusts beruht. Im Bereich der Zwei-Personen-Nullsummenspiele ist diese Unterscheidung aber belanglos.

Zusammenhang zwischen den Konzepten

Die enge Beziehung zwischen Minimax- und Maximin-Gleichgewichten bei Zwei-Personen-Nullsummenspielen ergibt sich bereits aus den Definitionen. Es gilt aber sogar der folgende Satz, der die Äquivalenz aller drei Konzepte sichert.

Satz: In einem Zwei-Personen-Nullsummenspiel ( S 1 , S 2 , u ) {\displaystyle (S_{1},S_{2},u)} stimmen die Mengen der Nash-Gleichgewichte, der Gleichgewichte in Minimax-Strategien und der Gleichgewichte in Maximin-Strategien überein.

Die Voraussetzung, dass es sich um ein Zwei-Personen-Nullsummenspiel handelt, ist dabei entscheidend. Im Allgemeinen fallen bereits die Begriffe „beste Reaktion“, „Minimax-Strategie“ und „Maximin-Strategie“ nicht zusammen. Für die konkrete Berechnung von Gleichgewichten in 2 Personen-Nullsummenspielen bedeutet der Satz, dass es genügt, die Gleichgewichte nach einem beliebigen der drei Konzepte zu ermitteln.

Lösungskonzepte

Endliche Strategiemengen

Bei endlicher Strategiemenge lassen sich die besten Reaktionen, Minimax- und Maximin-Strategien durch Ausprobieren finden. Anschließend kann man ebenfalls durch Ausprobieren feststellen, ob es sich um ein Gleichgewicht handelt.

In Beispiel (C) gilt S 1 = { o , u } {\displaystyle S_{1}=\{o,u\}} und S 2 = { l , m , r } {\displaystyle S_{2}=\{l,m,r\}} . In der Matrix wird die beste Reaktion von Spieler 1 auf Spieler 2 durch eine Unterstreichung, die beste Reaktion von Spieler 2 auf Spieler 1 durch einen Strich über der Zahl gekennzeichnet. Falls also Spieler 1 o spielt, sollte Spieler 2 mit r antworten, daher erhält die 3 {\displaystyle -3} eine Überstreichung. Das Matrixfeld ( u , m ) {\displaystyle (u,m)} ist gleichzeitig beste Reaktion für beide Spieler und somit ein Nash-Gleichgewicht. Da es keine weiteren derartigen Matrixfelder gibt, handelt es sich bei ( u , m ) {\displaystyle (u,m)} um das einzige Nash-Gleichgewicht dieses Spiels. Im Nash-Gleichgewicht erhält Spieler 1 eine Auszahlung von 2 {\displaystyle 2} , Spieler 2 eine Auszahlung von 2 {\displaystyle -2} .

( C ) l m r o 2 0 3 ¯ u 3 _ 2 _ ¯ 4 _ {\displaystyle {\begin{array}{c|rrr}(C)&l&m&r\\\hline o&-2&0&-{\overline {3}}\\u&{\underline {3}}&{\overline {\underline {2}}}&{\underline {4}}\end{array}}}

Bei „Matching Pennies“ (A) sehen die besten Reaktionen so aus:

( A ) K Z K 1 _ 1 ¯ Z 1 ¯ 1 _ {\displaystyle {\begin{array}{c|rr}(A)&K&Z\\\hline K&{\underline {1}}&-{\overline {1}}\\Z&-{\overline {1}}&{\underline {1}}\end{array}}}

Keine der Strategiekombinationen stellt ein Nash-Gleichgewicht dar, da nie beide eine beste Reaktion auf die gegnerische Strategie spielen.

Zur Ermittlung der Maximin-Strategien für Spieler 1 bestimmt man zunächst die Zeilenminima ZMin, siehe letzte Spalte.

( A ) K Z Z M i n K 1 1 1 Z 1 1 1 {\displaystyle {\begin{array}{c|rr|c}(A)&K&Z&ZMin\\\hline K&1&-1&-1\\Z&-1&1&-1\end{array}}}

Beide Zeilenminima sind gleich groß, so dass sowohl K als auch Z eine Maximin-Strategie für Spieler 1 darstellen. Es gilt V 1 = 1 {\displaystyle V_{1}=-1} ; Spieler 1 kann also sicherstellen, dass er nicht mehr als 1 verliert. Für Spieler 2 müssen analog die Spaltenmaxima SpMax ermittelt werden:

( A ) K Z K 1 1 Z 1 1 S p M a x 1 1 {\displaystyle {\begin{array}{c|rr}(A)&K&Z\\\hline K&1&-1\\Z&-1&1\\\hline SpMax&1&1\end{array}}}

Auch für ihn sind beide Strategien Maximin-Strategien; es gilt V 2 = 1 {\displaystyle V_{2}=1} . Nun ist aber V 2 > V 1 {\displaystyle V_{2}>V_{1}} , so dass auch kein Gleichgewicht in Maximin-Strategien vorliegt.

Bei „Schere, Stein, Papier“ liegen ähnliche Verhältnisse wie bei „Matching Pennies“ vor:

( B ) S S t P Z M i n S 0 1 ¯ 1 _ 1 S t 1 _ 0 1 ¯ 1 P 1 ¯ 1 _ 0 1 S p M a x 1 1 1 {\displaystyle {\begin{array}{c|rrr|c}(B)&S&St&P&ZMin\\\hline S&0&-{\overline {1}}&{\underline {1}}&-1\\St&{\underline {1}}&0&-{\overline {1}}&-1\\P&-{\overline {1}}&{\underline {1}}&0&-1\\\hline SpMax&1&1&1&\end{array}}}

Auch die Bestimmung der Maximin-Strategien führt wieder zu dem Ergebnis, dass für jeden Spieler jede seiner Strategien eine Maximin-Strategie ist; es gilt auch hier: 1 = V 2 > V 1 = 1 {\displaystyle 1=V_{2}>V_{1}=-1} .

„Matching Pennies“ und „Schere, Stein, Papier“ haben also kein Gleichgewicht in der Menge der vorgegebenen Strategiekombinationen. Um dieses Manko zu beheben, führt man gemischte Strategien ein.

Gemischte Strategien

Definition: Unter einer gemischten Strategie für Spieler 1 in einem Spiel ( S 1 , S 2 , u ) {\displaystyle (S_{1},S_{2},u)} versteht man eine Wahrscheinlichkeitsverteilung über der Strategienmenge S 1 {\displaystyle S_{1}} .

Lässt man für beide Spieler gemischte Strategien zu, so entsteht ein erweitertes Nullsummenspiel, bei dem jeder Spieler die Wahrscheinlichkeiten für seine Strategien wählt. Zur besseren Unterscheidung bezeichnet man die Strategien aus S 1 {\displaystyle S_{1}} bzw. S 2 {\displaystyle S_{2}} als reine Strategien der Spieler. Es handelt sich hierbei um besondere gemischte Strategien, bei denen eine Strategie aus S i {\displaystyle S_{i}} die Wahrscheinlichkeit 1 trägt. Möchte man betonen, dass keine Strategie die Wahrscheinlichkeit 1 trägt, so spricht man von einer echt gemischten Strategie.

Als Auszahlung u {\displaystyle u} für das erweiterte Nullsummenspiel nimmt man den Erwartungswert, der sich ergibt, wenn man davon ausgeht, dass die Wahrscheinlichkeitsverteilungen der Spieler unabhängig sind.

Für Matching Pennies führt dies zu folgender Erweiterung auf gemischte Strategien: Es sei s i [ 0 , 1 ] {\displaystyle s_{i}\in [0,1]} die Wahrscheinlichkeit, dass Spieler i {\displaystyle i} Kopf wählt. Bei Unabhängigkeit ergeben sich dann die folgenden Wahrscheinlichkeiten für die verschiedenen Strategiekombinationen:

P ( s 1 , s 2 ) K Z K s 1 s 2 s 1 ( 1 s 2 ) Z ( 1 s 1 ) s 2 ( 1 s 1 ) ( 1 s 2 ) {\displaystyle {\begin{array}{|c||c|c|}\hline P(s_{1},s_{2})&K&Z\\\hline \hline K&s_{1}s_{2}&s_{1}(1-s_{2})\\\hline Z&(1-s_{1})s_{2}&(1-s_{1})(1-s_{2})\\\hline \end{array}}}

Als Erwartungswert U {\displaystyle U} für die Auszahlung erhält man dann:

U ( s 1 , s 2 ) = s 1 s 2 1 + s 1 ( 1 s 2 ) ( 1 ) + ( 1 s 1 ) s 2 ( 1 ) + ( 1 s 1 ) ( 1 s 2 ) 1 = ( 2 s 1 1 ) ( 2 s 2 1 ) {\displaystyle U(s_{1},s_{2})=s_{1}s_{2}\cdot 1+s_{1}(1-s_{2})\cdot (-1)+(1-s_{1})s_{2}\cdot (-1)+(1-s_{1})(1-s_{2})\cdot 1=(2s_{1}-1)(2s_{2}-1)} .

Vergleicht man dies mit Beispiel (D) so sieht man, dass (B) gerade die Erweiterung von Matching Pennies auf gemischte Strategien darstellt ( u = U {\displaystyle u=U} ).

Bezeichnet man allgemein die Wahrscheinlichkeiten, die Spieler 1 für seine reinen Strategien aus S 1 = { s 1 1 , s 1 2 . . . , s 1 m } {\displaystyle S_{1}=\{s_{1}^{1},s_{1}^{2}...,s_{1}^{m}\}} wählt, mit x = ( x 1 , x 2 , . . . , x m ) T {\displaystyle x=(x_{1},x_{2},...,x_{m})^{T}} und ebenso die Wahrscheinlichkeiten für Spieler 2 mit y = ( y 1 , y 2 , . . . , y n ) T {\displaystyle y=(y_{1},y_{2},...,y_{n})^{T}} , so lässt sich U = E [ u ] {\displaystyle U=E[u]} als Matrizenprodukt schreiben; A {\displaystyle A} bezeichnet hierbei die Auszahlungsmatrix des Spiels:

U = x T A y {\displaystyle U=x^{T}Ay} .

Um eine beste Reaktion von Spieler 1 auf die gemischte Strategie y = ( y 1 , y 2 , . . . , y n ) T {\displaystyle y=(y_{1},y_{2},...,y_{n})^{T}} von Spieler 2 zu finden, muss also das lineare Optimierungsproblem

argmax x R m x T A y {\displaystyle {\text{argmax}}_{x\in \mathbb {R} ^{m}}\quad x^{T}Ay}     unter der Nebenbedingung     i = 1 m x i = 1 , x i 0 {\displaystyle \textstyle \sum _{i=1}^{m}x_{i}=1,x_{i}\geq 0} gelöst werden.

Umgekehrt findet man eine beste Reaktion von Spieler 2 auf die gemischte Strategie x = ( x 1 , x 2 , . . . , x m ) T {\displaystyle x=(x_{1},x_{2},...,x_{m})^{T}} von Spieler 1, indem man folgendes lineare Optimierungsproblem löst:

argmin y R n x T A y {\displaystyle {\text{argmin}}_{y\in \mathbb {R} ^{n}}\quad x^{T}Ay}      j = 1 n y j = 1 , y j 0 {\displaystyle \textstyle \sum _{j=1}^{n}y_{j}=1,y_{j}\geq 0} .

Eine Maximin-Strategie (bei Zwei-Personen-Nullsummenspielen äquivalent zur Minimax-Strategie) für Spieler 1 findet man, indem man folgendes Optimierungsproblem löst:

argmax x R m min y R n x T A y {\displaystyle {\text{argmax}}_{x\in \mathbb {R} ^{m}}\quad {\text{min}}_{y\in \mathbb {R} ^{n}}\quad x^{T}Ay}     unter der Nebenbedingung     i = 1 m x i = 1 , x i 0 , j = 1 n y j = 1 , y j 0 {\displaystyle \textstyle \sum _{i=1}^{m}x_{i}=1,x_{i}\geq 0,\sum _{j=1}^{n}y_{j}=1,y_{j}\geq 0} .[7]

Umgekehrt muss man für eine Maximin-Strategie von Spieler 2 folgendes Optimierungsproblem lösen:

argmin y R n max x R m x T A y {\displaystyle {\text{argmin}}_{y\in \mathbb {R} ^{n}}\quad {\text{max}}_{x\in \mathbb {R} ^{m}}\quad x^{T}Ay}     unter der Nebenbedingung     i = 1 m x i = 1 , x i 0 , j = 1 n y j = 1 , y j 0 {\displaystyle \textstyle \sum _{i=1}^{m}x_{i}=1,x_{i}\geq 0,\sum _{j=1}^{n}y_{j}=1,y_{j}\geq 0} .

Die Existenz von Gleichgewichten nach der Erweiterung auf gemischte Strategien wird durch das folgende Minimax-Theorem von John von Neumann (1928) sichergestellt:

Satz: Es sei A {\displaystyle A} eine reelle m × n {\displaystyle m\times n} -Matrix. Dann existiert ein Tripel ( x , y , V ) {\displaystyle (x^{*},y^{*},V)} , so dass

x T A y V y {\displaystyle {x^{*}}^{T}Ay\geq V\quad \forall y} und
x T A y V x {\displaystyle x^{T}Ay^{*}\leq V\quad \forall x} .[8]

Hierbei stehen x {\displaystyle x} bzw. x {\displaystyle x^{*}} für Wahrscheinlichkeitsverteilungen über die m {\displaystyle m} Zeilen von A {\displaystyle A} , y {\displaystyle y} bzw. y {\displaystyle y^{*}} für Wahrscheinlichkeitsverteilungen über die n {\displaystyle n} Spalten von A {\displaystyle A} .

Damit hat jedes Zwei-Personen-Nullsummenspiel mit endlichen Strategiemengen für beide Spieler mindestens ein Gleichgewicht in gemischten Strategien. Jede gleichgewichtige bzw. Minimax- oder Maximin-Strategie eines Spielers bildet mit jeder gleichgewichtigen bzw. Minimax- oder Maximin-Strategie des anderen Spielers (in der Erweiterung des Spiels auf gemischte Strategien) ein Gleichgewicht.

Beispiele (Fortsetzung)

Matching Pennies

Es sollen nun für „Matching Pennies“ (A) die Maximin-Strategien für Spieler 1 in gemischten Strategien ermittelt werden:

Zunächst muss für jede vorgegebene Strategie s ¯ 1 {\displaystyle {\overline {s}}_{1}} von Spieler 1 seine minimale Auszahlung bestimmt werden, die sich durch optimales Verhalten von Spieler 2 ergibt:

min s 2 [ 0 , 1 ] u ( s ¯ 1 , s 2 ) {\displaystyle {\text{min}}_{s_{2}\in [0,1]}\quad u({\overline {s}}_{1},s_{2})} .

Es gilt:

u ( s ¯ 1 , s 2 ) = s ¯ 1 s 2 s ¯ 1 ( 1 s 2 ) ( 1 s ¯ 1 ) s 2 + ( 1 s ¯ 1 ) ( 1 s 2 ) = 1 2 s ¯ 1 + ( 4 s ¯ 1 2 ) s 2 {\displaystyle u({\overline {s}}_{1},s_{2})={\overline {s}}_{1}s_{2}-{\overline {s}}_{1}(1-s_{2})-(1-{\overline {s}}_{1})s_{2}+(1-{\overline {s}}_{1})(1-s_{2})=1-2{\overline {s}}_{1}+(4{\overline {s}}_{1}-2)s_{2}} .

Für die Minimierung bezüglich s 2 {\displaystyle s_{2}} kommt es nur darauf an, ob der Ausdruck 4 s ¯ 1 2 {\displaystyle 4{\overline {s}}_{1}-2} in der letzten Klammer positiv, Null oder negativ ist. Dieser Ausdruck ist positiv, falls s ¯ 1 > 1 2 {\displaystyle \textstyle {\overline {s}}_{1}>{\frac {1}{2}}} . Dann wird das Minimum für s 2 = 0 {\displaystyle s_{2}=0} erreicht, und beträgt 1 2 s ¯ 1 {\displaystyle 1-2{\overline {s}}_{1}} . Der Ausdruck in der Klammer ist negativ, falls s ¯ 1 < 1 2 {\displaystyle \textstyle {\overline {s}}_{1}<{\frac {1}{2}}} . Dann wird das Minimum für s 2 = 1 {\displaystyle s_{2}=1} erreicht, und beträgt 1 + 2 s ¯ 1 {\displaystyle -1+2{\overline {s}}_{1}} . Der Ausdruck in der Klammer ist Null, falls s ¯ 1 = 1 2 {\displaystyle \textstyle {\overline {s}}_{1}={\frac {1}{2}}} , s 2 {\displaystyle s_{2}} hat dann keinen Einfluss auf das Minimum, u ( s ¯ 1 , s 2 ) {\displaystyle u({\overline {s}}_{1},s_{2})} ist dann unabhängig von s 2 {\displaystyle s_{2}} immer 0.

Grafik

Damit lässt sich min s 2 [ 0 , 1 ] u ( s ¯ 1 , s 2 ) {\displaystyle {\text{min}}_{s_{2}\in [0,1]}\quad u({\overline {s}}_{1},s_{2})} wie folgt schreiben:

U min ( s ¯ 1 ) := min s 2 [ 0 , 1 ] u ( s ¯ 1 , s 2 ) = { 1 + 2 s ¯ 1 für s ¯ 1 < 1 2 1 2 s ¯ 1 für s ¯ 1 1 2 {\displaystyle \textstyle U_{\min }({\overline {s}}_{1}):={\text{min}}_{s_{2}\in [0,1]}\quad u({\overline {s}}_{1},s_{2})={\begin{cases}-1+2{\overline {s}}_{1}&{\text{für}}{\overline {s}}_{1}<{\frac {1}{2}}\\1-2{\overline {s}}_{1}&{\text{für}}{\overline {s}}_{1}\geq {\frac {1}{2}}\end{cases}}}

Somit erhält man für die Bestimmung der Maximin-Strategie für Spieler 1 folgendes Optimierungsproblem:

argmax s 1 [ 0 , 1 ] min s 2 [ 0 , 1 ] u ( s 1 , s 2 ) = argmax s 1 [ 0 , 1 ] U min ( s 1 ) {\displaystyle \textstyle {\text{argmax}}_{s_{1}\in [0,1]}\min _{s_{2}\in [0,1]}\;u(s_{1},s_{2})={\text{argmax}}_{s_{1}\in [0,1]}\;U_{\min }(s_{1})} .

U min {\displaystyle U_{\min }} ist streng monoton steigend auf dem Intervall [ 0 , 1 2 ] {\displaystyle \textstyle \left[0,{\frac {1}{2}}\right]} und streng monoton fallend auf dem Intervall [ 1 2 , 1 ] {\displaystyle \textstyle \left[{\frac {1}{2}},1\right]} ; das Maximum von U min {\displaystyle U_{\min }} liegt also bei s 1 = 1 2 {\displaystyle \textstyle s_{1}^{*}={\frac {1}{2}}} . Dies ist also die eindeutige Maximin-Strategie für Spieler 1 in gemischten Strategien. Aus Symmetriegründen gibt es auch nur eine Maximin-Strategie für Spieler 2, nämlich s 2 = 1 2 {\displaystyle \textstyle s_{2}^{*}={\frac {1}{2}}} .

Der Wert des Spiels beträgt V = 0 {\displaystyle V=0} . Aufgrund des Äquivalenzsatzes ist dies auch das einzige Nash-Gleichgewicht und auch das einzige Gleichgewicht in Minimax-Strategien.

Schere, Stein, Papier

Für „Schere, Stein, Papier“ argumentiert man wie folgt. Falls Spieler 1 nicht alle drei reinen Strategien mit der gleichen Wahrscheinlichkeit spielt, so kann Spieler 2 durch Wahl einer geeigneten Strategie dafür sorgen, dass die erwartete Auszahlung von Spieler 1 negativ wird. Es sei zum Beispiel p 1 := P ( S ) P ( S t ) P ( P ) =: p 3 {\displaystyle p_{1}:=P(S)\geq P(St)\geq P(P)=:p_{3}} , wobei mindestens eine der Ungleichungen strikt ist. Insbesondere ist dann p 1 > p 3 {\displaystyle p_{1}>p_{3}} . Wenn Spieler 2 jetzt „Stein“ spielt, so ist die erwartete Auszahlung von Spieler 1 E u = p 1 ( 1 ) + p 3 1 = p 3 p 1 < 0 {\displaystyle Eu=p_{1}\cdot (-1)+p_{3}\cdot 1=p_{3}-p_{1}<0} .

Wählt Spieler 1 hingegen alle drei Wahrscheinlichkeiten gleich 1 3 {\displaystyle \textstyle {\frac {1}{3}}} , also x T = ( 1 3 1 3 1 3 ) {\displaystyle \textstyle x^{T}={\begin{pmatrix}{\frac {1}{3}}&{\frac {1}{3}}&{\frac {1}{3}}\end{pmatrix}}} , so ist seine erwartete Auszahlung 0 für jede gemischte Strategie von Spieler 2. Seine erwartete Auszahlung ist dann nämlich:

E ( u ) = x T A y = [ x T A ] y = [ ( 1 3 1 3 1 3 ) ( 0 1 1 1 0 1 1 1 0 ) ] ( y 1 y 2 y 3 ) = ( 0 0 0 ) ( y 1 y 2 y 3 ) = 0 {\displaystyle \textstyle \operatorname {E} (u)=x^{T}Ay=[x^{T}A]y=\left[{\begin{pmatrix}{\frac {1}{3}}&{\frac {1}{3}}&{\frac {1}{3}}\end{pmatrix}}{\begin{pmatrix}0&-1&1\\1&0&-1\\-1&1&0\end{pmatrix}}\right]{\begin{pmatrix}y_{1}\\y_{2}\\y_{3}\end{pmatrix}}={\begin{pmatrix}0&0&0\end{pmatrix}}{\begin{pmatrix}y_{1}\\y_{2}\\y_{3}\end{pmatrix}}=0} .

Falls die Wahrscheinlichkeiten bei Spieler 1 auf Schere, Stein und Papier in anderer Größenreihenfolge verteilt sind, so gilt eine analoge Argumentation, falls Spieler 2 die Strategie mit der mittleren Wahrscheinlichkeit spielt.

Zu jeder von x T = ( 1 3 1 3 1 3 ) {\displaystyle \textstyle x^{T}={\begin{pmatrix}{\frac {1}{3}}&{\frac {1}{3}}&{\frac {1}{3}}\end{pmatrix}}} verschiedenen Strategie existiert also eine Strategie von Spieler 2, die Spieler 1 eine negative Auszahlung liefert. Somit ist x T = ( 1 3 1 3 1 3 ) {\displaystyle \textstyle x^{T}={\begin{pmatrix}{\frac {1}{3}}&{\frac {1}{3}}&{\frac {1}{3}}\end{pmatrix}}} die eindeutige Maximin-Strategie von Spieler 1.

Aus Symmetriegründen gilt das auch für Spieler 2. Damit ist diese Strategiekombination das einzige gemischte Gleichgewicht und der Wert des Spiels ist V = 0 {\displaystyle V=0} .

Literatur

  • Avinash K. Dixit, Barry J. Nalebuff: Spieltheorie für Einsteiger. Schäffer Poeschl, Stuttgart 1997, ISBN 3-7910-1239-8.
  • Christian Rieck: Spieltheorie. Eine Einführung. Christian Rieck Verlag, 1993, S. 102–104.
  • Diether Coenen: Quasi-Nullsummenspiele und dominierte Gleichgewichtspunkte in Bimatrix-Spielen. Westdeutscher Verlag, 1967.
  • G. Owen: Spieltheorie. Springer-Verlag, 1971.
  • Morton D. Davis: Spieltheorie für Nichtmathematiker. Oldenbourg Verlag, 1993, S. 15–35, doi:10.1524/9783486836103
  • Burkhard Rauhut, Norbert Schmitz, Ernst-Wilhelm Zachow: Spieltheorie. Teubner, Stuttgart 1979, ISBN 3-519-02351-2.
  • Sylvain Sorin: A First Course on zero-sum Repeated Games. Springer, 2002.
  • Thomas Riechmann: Spieltheorie. Verlag Franz Vahlen, 2002, S. 63–67.
  • Werner Krabs: Spieltheorie. Teubner, Wiesbaden 2005.

Einzelnachweise

  1. G. Owen: Spieltheorie. Springer-Verlag, 1971, S. 11.
  2. Manfred J. Holler, Gerhard Illing: Einführung in die Spieltheorie. Springer, 2008, ISBN 978-3-540-69372-7, S. 4.
  3. Sylvain Sorin: A First Course on Zero-Sum Repeated Games. Springer-Verlag, Berlin/ Heidelberg 2002, S. 151.
  4. Christian Rieck: Spieltheorie Eine Einführung. Christian Rieck Verlag, 1993, S. 80.
  5. G. Owen: Spieltheorie. Springer Verlag, 1971, S. 17.
  6. B. Rauhut, N. Schmitz, E.-W. Zachow: Spieltheorie. Teubner, Stuttgart 1979, S. 138.
  7. G. Owen: Spieltheorie. Springer-Verlag, Berlin/ Heidelberg/ New York 1997, S. 16.
  8. Sylvain Sorin: A First Course on Zero-Sum Repeated Games. Springer-Verlag Berlin/ Heidelberg/ New york, S. 154.