Дипломная работа: Теория игр
Задача каждого из игроков - найти наилучшую стратегию игры, при этом предполагается, что противники одинаково разумны и каждый из них делает все, чтобы получить наибольший доход.
Найдем наилучшую стратегию первого игрока. Если игрок А выбрал стратегию А i , , то в худшем случае (например, если его ход известен В) он получит выигрыш . Предвидя такую возможность, игрок А должен выбрать такую стратегию, чтобы максимизировать свой минимальный выигрыш.
.
Определение 2. Величина a - гарантированный выигрыш игрока А называется нижней ценой игры. Стратегия Ai опт , обеспечивающая получение выигрыша a, называется максиминной.
Если первый игрок будет придерживаться своей максиминной стратегии, то у него есть гарантия, что он в любом случае выиграет не меньше a.
Аналогично определяется наилучшая стратегия второго игрока. Игрок В при выборе стратегии В j , в худшем случае получит проигрыш . Он выбирает стратегию Bj опт , при которой его проигрыш будет минимальным и составит
.
Определение 3. Величина b - гарантированный проигрыш игрока В называется верхней ценой игры. Стратегия Bj опт , обеспечивающая получение проигрыша b, называется минимаксной.
Если второй игрок будет придерживаться своей минимаксной стратегии, то у него есть гарантия, что он в любом случае проиграет не больше b.
Фактический выигрыш игрока А (проигрыш игрока В) при разумных действиях партнеров ограничен верхней и нижней ценой игры. Для матричной игры справедливо неравенство a£b.
Определение 4. Если a = b = v, т.е.
= ,
то выигрыш игрока А (проигрыш игрока В) определяется числом v. Оно называется ценой игры.
Определение 5. Если a = b = v, то такая игра называется игрой с седловой точкой, элемент матрицы а iопт jопт = v, соответствующий паре оптимальных стратегий ( Ai опт , Bj опт ), называется седловой точкой матрицы. Этот элемент является ценой игры.
Седловой точке соответствуют оптимальные стратегии игроков. Их совокупность - решение игры, которое обладает свойством: если один из игроков придерживается оптимальной стратегии, то второму отклонение от своей оптимальной стратегии не может быть выгодным.
Определение 6. Если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях.
Найдем решение игры рассмотренного выше примера:
,
a = a 3 - нижняя цена игры.
,
b = b 3 - верхняя цена игры.
Так как a = b = 0, матрица игры имеет седловую точку.
Оптимальная стратегия первого игрока - А3 , второго - B 3 . Из таблицы видно, что отклонение первого игрока от оптимальной стратегии уменьшает его выигрыш, а отклонение второго игрока от В 3 увеличивает его проигрыш.
Наличие седловой точки в игре - это далеко не правило, скорее, исключение. Существует разновидность игр, которые всегда имеют седловую точку и, значит, решаются в чистых стратегиях. Это так называемые игры с полной информацией.
Определение 7. Игрой с полной информацией называется такая игра, в которой каждый игрок при каждом личном ходе знает всю предысторию ее развития, т.е. результаты всех предыдущих ходов.
Примерами игр с полной информацией могут служить шашки, шахматы, "крестики-нолики" и т.д.
Теорема 1. Каждая игра с полной информацией имеет седловую точку и, значит, имеет решение в чистых стратегиях.
В каждой игре с полной информацией существует пара оптимальных стратегий, дающая устойчивый выигрыш, равный цене игры v . Если решение игры известно, сама игра теряет смысл. Например, шахматная игра либо кончается выигрышем белых, либо выигрышем черных, либо ничьей, только чем именно - мы пока не знаем (к счастью для любителей шахмат). Прибавим еще: вряд ли будем знать в обозримом будущем, так как число стратегий так велико, что крайне трудно привести шахматную игру к матричной форме и найти в ней седловую точку. Указать откуда это взялось, т.е. указать ссылки
1.3 Решение матричной игры в смешанных стратегиях
Если платежная матрица не имеет седловой точки, т.е. a < b и , то поиск решения игры приводит к применению сложной стратегии, состоящей в случайном применении двух и более стратегий с определенными частотами.