You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
8.2. Оптимальний розв’язок в іграх двох осіб<br />
з нульовою сумою<br />
Розглянемо гру, в якій беруть участь два гравці, один з яких<br />
може дотримуватися стратегії i з n своїх можливих (і =1, 2,…, n), а<br />
другий, не знаючи вибору першого, вибирає стратегію j із m своїх<br />
можливих стратегій ( j =1, 2, …, m). У результаті перший гравець (A)<br />
виграє ai , а другий (B) програє цю величину.<br />
Величини aij утворюють платіжну матрицю (матрицю гри):<br />
B B<br />
[ a ]<br />
ij<br />
=<br />
A<br />
A<br />
<br />
A<br />
1<br />
2<br />
n<br />
⎡ a<br />
⎢<br />
a<br />
⎢<br />
⎢ <br />
⎢<br />
⎣a<br />
n<br />
1 m<br />
11<br />
21<br />
1<br />
229<br />
<br />
<br />
<br />
<br />
a<br />
a<br />
a<br />
1m<br />
2m<br />
<br />
nm<br />
⎤<br />
⎥<br />
⎥ . (8.1)<br />
⎥<br />
⎥<br />
⎦<br />
Рядки матриці [aij] відповідають стратегіям (А1, …, Аn) гравця А.<br />
А стовпці – стратегіям (В1, …, Вm) гравця B. Такі стратегії<br />
називаються чистими. Будемо вважати, що при aij > 0 гравець А<br />
виграє, а гравець B програє величину aij. Якщо aij < 0, то, навпаки,<br />
виграє гравець B і програє гравець А.<br />
Спочатку знайдемо найкращу зі стратегій гравця А, тобто<br />
найкращу серед А1,…, Аn з урахуванням можливих варіантів<br />
відповідей на неї гравця B. При цьому необхідно враховувати те, що<br />
на довільну стратегію Аі гравець B відповідає стратегією Вj, для якої<br />
виграш гравця А буде мінімальним. Для знаходження стратегії Вj<br />
α = min a . При<br />
необхідно в і-му рядку платіжної матриці знайти i { ij}<br />
зміні стратегії гравця А одночасно будуть змінюватися відповідні їм<br />
числа αі. Зрозуміло, що гравцеві А вигідно завжди зупинятися на<br />
α = max a , або, враховуючи<br />
такій стратегії Аі, для якої значення { }<br />
представлення αі, отримаємо max min{ aij}<br />
α= .<br />
i j<br />
Число α називається нижньою ціною гри чи максиміном, а<br />
відповідна йому стратегія (рядок) – максимінною.<br />
Якщо гравець А буде дотримуватися максимінної стратегії, то<br />
йому, при довільній поведінці гравця В, в будь-якому випадку<br />
гарантований виграш, не менший α. Аналогічно можна визначити<br />
найкращу стратегію для гравця В, мета якого – звести виграш гравця<br />
i<br />
i<br />
j