1. Примери на игри от Теория на игрите

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 14

1.

Примери на игри
от
Теория на игрите
ТЕОРИЯ НА ИГРИТЕ – ЛЕКЦИЯ
ГЛ. АС. Д-Р СИЛВИЯ БАЕВА
Пример
на
Матричната игра с нулева сума
Модел
на
Производство на
допълнителна продукция
Постановка
Две предприятия 𝑨 и 𝑩 от един и същи град
освен основната си продукция имат намерение да
произвеждат допълнителна продукция – една и
съща стока, различаваща се по оформление,
опаковка и други удобства.
 Предприятието 𝑨 може да пусне на пазара
продукция от типове 𝑨𝟏 , 𝑨𝟐 , … , 𝑨𝒎 , а 𝑩 от типовете
𝑩𝟏 , 𝑩𝟐 , … , 𝑩𝑴 .
 Отделът по прогнозиране установява, че в
града се търсят 𝑵 единици стока от всички типове.
Ако предприятието 𝑨 (1 играч) пусне продукцията
от типа 𝑨𝒊 , а предприятието 𝑩 (2 играч) –
продукция от типа 𝑩𝒋 , то в града ще се пласират
𝒑𝒊𝒋. 𝑵 стоки от типа 𝑨𝒊 и (𝟏 − 𝒑𝒊𝒋). 𝑵 стоки от типа 𝑩𝒋,
𝟎 ≤ 𝒑𝒊𝒋 ≤ 𝟏. Мощностите на двете предприятия са
такива, че могат да задоволят града с продукция.
 Нека дохода от продажбата на единица стока е
равен на 𝟏, а полезността от 𝟏 играч е равна на
дохода от продажбата. Платежната матрица на 𝟏
играч е
𝒑𝟏𝟏 . 𝑵 𝒑𝟏𝟐 . 𝑵 … 𝒑𝟏𝑴 . 𝑵
𝑯𝟏 = 𝑯 = 𝒑𝟐𝟏 …
. 𝑵 𝒑𝟐𝟐 . 𝑵 … 𝒑𝟐𝑴 . 𝑵
… … …
𝒑𝒎𝟏 . 𝑵 𝒑𝒎𝟐 . 𝑵 … 𝒑𝒎𝑴 . 𝑵
По аналогичен начин може да запишем
матрицата на 𝟐 играч – елемента (𝒊, 𝒋) е равен на
𝟏 − 𝒑𝒊𝒋 . 𝑵:
𝟏 − 𝒑𝟏𝟏 . 𝑵 𝟏 − 𝒑𝟏𝟐 . 𝑵 … 𝟏 − 𝒑𝟏𝑴 . 𝑵
𝑯𝟐 = 𝟏 − 𝒑𝟐𝟏 . 𝑵 𝟏 − 𝒑𝟐𝟐 . 𝑵 … 𝟏 − 𝒑𝟐𝑴 . 𝑵
… … … …
𝟏 − 𝒑𝒎𝟏 . 𝑵 𝟏 − 𝒑𝒎𝟐 . 𝑵 … 𝟏 − 𝒑𝒎𝑴 . 𝑵
Тъй като сумата на доходите на двамата играчи
в произволна ситуация (𝒊, 𝒋) е равна на 𝑵 = 𝒑𝒊𝒋. 𝑵 +
(𝟏 − 𝒑𝒊𝒋). 𝑵, то увеличението на дохода 𝟏 играч е за
сметка на намаляване на дохода на 𝟐 играч.
Следователно, за дадения конфликт може да
моделираме с антагонистична игра 𝜞 с матрица 𝑯𝟏 .
 Търсим оптималния вариант за
производството на стоки от различните типове на
двете предприятия такива, че те да реализират
най-голям доход.
Решение

 Решението на играта определя максималните


стратегии 𝒑𝟎 и 𝒒𝟎 , на 𝟏 и 𝟐 играчи, а също и
математическото очакване на печалбата на 𝟏
играч равна на 𝝂. Математическото очакване на
печалбата на 𝟐 играч е равна на – 𝝂 . Тъй като
сумата на продадените стоки е равна на 𝑵 ,
математическото очакване на реализираните
стоки на предприятие 𝑩 е равно на 𝑵 – 𝝂.
Числовия пример е представен с 𝑵 = 𝟏𝟎𝟎𝟎, 𝒎 = 𝟓,
𝑪𝟏 = 𝑪𝟐 = 𝑪𝟑 = 𝑪𝟒 = 𝑪𝟓 = 𝟏, а относителните дялове на
продажбите на различните видове стоки на фирма 𝑨
в града са дадени в таблицата:
Фирма 𝑩 (𝟐 играч)
Фирма 𝑨 (𝟏 играч) 𝑩𝟏 𝑩𝟐 𝑩𝟑 𝑩𝟒 𝑩𝟓
𝑨𝟏 0,2 0,1 0,3 0,2 0,4
𝑨𝟐 0,2 0,5 0,3 0,4 0,8
𝑨𝟑 0,3 0,7 0,2 0,4 0,7
𝑨𝟒 0,5 0,4 0,4 0,5 0,6
𝑨𝟓 0,2 0,3 0,1 0,3 0,5

Всеки един от елементите 𝒑𝒊𝒋 на тази таблица


показва относителния дял на продажбите на стока
от вида на 𝑨𝒊 предлагана от фирма 𝑨, ако на пазара в
града се предлага още само стоката 𝑩𝒋 от фирма 𝑩.
Платежната матрица на 𝟏 играч (фирма 𝑨) е (в
хил. лева):
𝟐𝟎𝟎 𝟏𝟎𝟎 𝟑𝟎𝟎 𝟐𝟎𝟎 𝟒𝟎𝟎
𝟐𝟎𝟎 𝟓𝟎𝟎 𝟑𝟎𝟎 𝟒𝟎𝟎 𝟖𝟎𝟎
𝑯 = 𝑵. 𝑷𝒊𝒋 = 𝟑𝟎𝟎 𝟕𝟎𝟎 𝟐𝟎𝟎 𝟒𝟎𝟎 𝟕𝟎𝟎
𝟓𝟎𝟎 𝟒𝟎𝟎 𝟒𝟎𝟎 𝟓𝟎𝟎 𝟔𝟎𝟎
𝟐𝟎𝟎 𝟑𝟎𝟎 𝟏𝟎𝟎 𝟑𝟎𝟎 𝟓𝟎𝟎
 И 𝚪 =< 𝑴, 𝑵, 𝑯 > е крайна антагонистична
∗ ∗
(𝒎 × 𝒏) игра, 𝚪′ =< 𝑴, 𝑵/{𝒋 }, 𝑯′ > е подигра на 𝚪, а 𝒋 -
та чиста стратегия на 𝟏 играч в играта 𝚪 ,

доминируема от някоя стратегия 𝒒 , спектърът на

която не съдържа 𝒋 , тогава всяко решение
(𝒑𝟎, 𝒒𝟎, 𝑽) на играта 𝚪′ е решение на играта 𝚪.
 Следователно, играта 𝚪 =< 𝑴, 𝑵, 𝑯 > е
еквивалентна с играта 𝚪 =< 𝑴, 𝑵, 𝑯 > , където
𝑯′ = 𝟏/𝟏𝟎𝟎
В матрична форма:
𝟐 𝟏 𝟑 𝟐 𝟒
𝟐 𝟓 𝟑 𝟒 𝟖
𝑯′ = 𝟑 𝟕 𝟐 𝟒 𝟕
𝟓 𝟒 𝟒 𝟓 𝟔
𝟐 𝟑 𝟏 𝟑 𝟓
Елементите на втория ред на матрицата 𝑯′ са по-
големи или равни от съответните елементи на първия
ред и втората стратегия на 𝟏 играч доминира първата.
Както и елементите на четвъртия ред са по- големи или
равни от съответните елементи на петия ред и
четвъртата стратегия на първия играч доминира петата.
Елементите на петия стълб са по-големи или равни от
елементите на втория стълб, т.е. петата стратегия на 𝟐
играч доминира втората. Както и елементите на третия и
четвъртия стълб са по-малки или равни от елементите на
първия стълб, или третата и четвъртата стратегия на 𝟐
играч доминират първата.
𝜞 =< 𝑴, 𝑵, 𝑯 > е крайна антагонистична (𝒎 × 𝒏) игра,
∗ ∗
𝜞′ =< 𝑴, 𝑵/{𝒋 }, 𝑯′ > е подигра на 𝜞, а 𝒋 -та чиста стратегия
на 𝟏 играч в играта 𝜞, доминируема от някоя стратегия
∗ ∗
𝒒 , спектърът на която не съдържа 𝒋 , тогава всяко
решение (𝒑𝟎, 𝒒𝟎, 𝑽) на играта 𝜞′ е решение на играта 𝜞.
От тази теорема следва, че всяко решение на
играта 𝜞𝟐 =< 𝑿/{𝟏, 𝟓}, 𝒀/{𝟑, 𝟒, 𝟓}, 𝑯𝟐 > е решение и на играта
𝜞′ =< 𝑴, 𝑵, 𝑯′ > . В матрична форма играта 𝜞𝟐 се задава с
матрицата:
𝟐 𝟓
𝑯𝟐 = 𝟑 𝟕
𝟓 𝟒
 Втората стратегия на 𝟏 играч доминира
съответно първата стратегия. Съгласно теоремата,
където 𝜞 стратегията 𝒑𝟎 (𝒒𝟎 ) е оптимална, то 𝒑𝟎(𝒒𝟎 ) е
строго доминируема. Решението на играта 𝜞𝟑 = <
𝑿/{𝟏, 𝟐, 𝟓}, 𝒀/{𝟑, 𝟒, 𝟓}, 𝑯𝟑 >, се явява решение на играта 𝚪𝟐, а
следователно и на игрите 𝚪′ и 𝚪.
𝟒 𝟕
Играта 𝚪𝟑 се задава с матрицата: 𝑯𝟑 =
𝟓 𝟑
Матрицата 𝑯𝟑 няма седлова точка, тъй като 𝑽 = 𝟒 <
𝟓 = 𝑽 , т.е. оптималните стратегии са смесени. Тези
стратегии и цената на играта 𝚪𝟑 намираме по формулите:
𝒑𝟎𝟑 𝟎𝟑
𝟏𝟏 − 𝒑𝟐𝟐 𝟑−𝟒 −𝟏 𝟏
𝒑𝟎𝟑
𝟏 = = = =
𝒑𝟎𝟑
𝟏𝟏 − 𝒑 𝟎𝟑
𝟏𝟐 − 𝒑 𝟎𝟑
𝟐𝟏 + 𝒑 𝟎𝟑
𝟐𝟐 𝟑 − 𝟕 − 𝟓 + 𝟒 −𝟓 𝟓
𝟏 𝟒 𝟏 𝟒
𝒑𝟎𝟑
𝟐 =𝟏− 𝒑𝟎𝟑
𝟏 =𝟏− = ⇒ 𝑷 𝟎𝟑 ;
𝟓 𝟓 𝟓 𝟓
𝒒𝟎𝟑
𝟐𝟐 − 𝒒 𝟎𝟑
𝟏𝟐 𝟒−𝟕 −𝟑 𝟑
𝒒𝟎𝟑
𝟏 = = = =
𝒒𝟎𝟑
𝟏𝟏 − 𝒒 𝟎𝟑
𝟏𝟐 − 𝒒 𝟎𝟑
𝟐𝟏 + 𝒒 𝟎𝟑
𝟐𝟐 𝟑 − 𝟕 − 𝟓 + 𝟒 −𝟓 𝟓
𝟑 𝟐 𝟑 𝟐
𝒒𝟎𝟑
𝟐 =𝟏− 𝒒𝟎𝟑
𝟏 =𝟏− = ⇒ 𝑸 𝟎𝟑 ;
𝟓 𝟓 𝟓 𝟓
𝒑𝟎𝟑 .
𝟐𝟐 𝟏𝟏𝒑 𝟎𝟑
− 𝒑 𝟎𝟑 𝟎𝟑
𝟏𝟐 . 𝒑𝟐𝟏 𝟒. 𝟑 − 𝟕. 𝟓 𝟏𝟐 − 𝟑𝟓 −𝟐𝟑 𝟐𝟑
𝑽𝟎𝟑 = = = = =
𝒑𝟎𝟑 𝟎𝟑 𝟎𝟑 𝟎𝟑
𝟏𝟏 − 𝒑𝟏𝟐 − 𝒑𝟐𝟏 + 𝒑𝟐𝟐 𝟑−𝟕−𝟓+𝟒 −𝟓 −𝟓 𝟓
Оптималните стратегии на цената на играта 𝚪 са:
𝟎𝟑
𝟏 𝟒 𝟎𝟑
𝟑 𝟐 𝟎𝟑
𝟐𝟑
𝑷 ; ;𝑸 ; ;𝑽 =
𝟓 𝟓 𝟓 𝟓 𝟓
𝟎𝟑
𝟐𝟑
𝑽𝑨 = 𝑽 . 𝟏𝟎𝟎 = . 𝟏𝟎𝟎 = 𝟒𝟔𝟎
𝟓
𝑽𝑩 = 𝑵 − 𝑽𝑨 = 𝟏𝟎𝟎𝟎 − 𝟒𝟔𝟎 = 𝟓𝟒𝟎
𝟎
𝟏 𝟓
𝑷 = 𝟎; 𝟎; ; ; 𝟎
𝟓 𝟒
𝟎
𝟑 𝟐
𝑸 = ; ; 𝟎; 𝟎; 𝟎
𝟓 𝟓
 На практика означава, че търговската фирма 𝑨
трябва да избира продажби на стока от видове 𝑨𝟑 и 𝑨𝟒 с
𝟏 𝟒
вероятности и , а фирма 𝑩 да избира стока от
𝟓 𝟓
𝟑 𝟐
видовете 𝑩𝟏 и 𝑩𝟐 с вероятности и съответно.
𝟓 𝟓
 Тогава търговската фирма 𝑨 ще реализира доход
𝟒𝟔𝟎 лева, а втората 𝑵 − 𝑽А = 𝟓𝟒𝟎 лева.
 Доходите на двете фирми са гарантирани, ако 𝟏
и 𝟐 играч се придържат към оптималните си
стратегии. Ако единият от тях избере друга
стратегия, то той ще получи по-малко.
 При отклонение на няколко играчи те могат да
получат по–големи печалби, отколкото при
равновестната ситуация. При възможна
кооперация между играчите, принципът на
равновесието е неоправдан. При възможност за
коопериране възниква противоречие между
устойчивостта на операцията, изразена във вид на
равновестност и стремежът на играчите към по–
голяма печалба.

You might also like