Реферат: Теория игр

Отсюда следует, что при u ¹ 0 столбцы матрицы А не могут быть пропорциональны с коэффициентом пропорциональности, отличным от единицы. Если же коэффициент пропорциональности равен единице, то матрица А принимает вид

и игрок 1 имеет чистую оптимальную стратегию (он выбирает с вероятностью 1 ту из строк, элементы которой не меньше соответствующих элементов другой), что противоречит предположению. Следовательно, если u ¹ 0 и игроки имеют только смешанные оптимальные стратегии, то определитель матрицы А отличен от нуля. Из этого следует, что последняя система уравнений имеет единственное решение. Решая её, находим

;

.

Аналогичные рассуждения приводят нас к тому, что оптимальная стратегия игрока 2 Y = (h , 1 - h ) удовлетворяет системе уравнений

откуда

.

Графический метод решения игр 2 х n И m х 2.

Поясним метод на примерах.

Пример 1 .

Рассмотрим игру, заданную платёжной матрицей.

На плоскости хОy введём систему координат и на оси Ох отложим отрезок единичной длины А1 , А2 , каждой точке которого поставим в соответствие некоторую смешанную стратегию игрока 1 (х, 1 - х). В частности, точке А1 (0;0) отвечает стратегия А1 , точке А2 (1;0) – стратегия А2 и т.д.

y

11

7

М N 5

3

2 u 2

x

В точках А1 и А2 восстановим перпендикуляр и на полученных прямых будем откладывать выигрыш игроков. На первом перпендикуляре (в данном случае он совпадает с осью 0y ) отложим выигрыш игрока 1 при стратегии А1 , а на втором – при стратегии А2 . Если игрок 1 применит стратегию А1 , то выиграет при стратегии В1 игрока 2 – 2, при стратегии В2 – 3, а при стратегии В3 – 11. Числам 2, 3, 11 на оси соответствуют точки В1 , В2 и В3 .

Если же игрок 1 применит стратегию А2 , то его выигрыш при стратегии В1 равен 7, при В2 – 5, а при В3 – 2. Эти числа определяют точки В¢1 , В2 ¢, В3 ¢ на перпендикуляре, восстановленном в точке А2 .Соединяя между собой точки В1 и В¢1 , В2 и В¢2 , В3 и В¢3 получим три прямые, расстояние до которых от оси определяет средний выигрыш при любом сочетании соответствующих стратегий. Например, расстояние от любой точки отрезка В1 В¢1 до оси определяет средний выигрыш u1 при любом сочетании стратегий А1 А2 (с частотами х и 1–х ) и стратегией В1 игрока 2. Это расстояние равно

2х1 + 6(1 -х2 ) = u1

(Вспомните планиметрию и рассмотрите трапецию А1 B11 A2 ). Таким образом, ординаты точек, принадлежащих ломанной В1 MN В¢3 определяют минимальный выигрыш игрока 1 при применении им любых смешанных стратегий. Эта минимальная величина является максимальной в точке N; следовательно этой точке соответствует оптимальная стратегия Х* = (х , 1-х ), а её ордината равна цене игры u . Координаты точки N находим как точку пересечения прямых В22 и В33 .

Соответствующие два уравнения имеют вид

.

Следовательно Х = (; ), при цене игры u = . Таким образом мы можем найти оптимальную стратегию при помощи матрицы

К-во Просмотров: 1606
Бесплатно скачать Реферат: Теория игр