Учебное пособие: Теория принятия решений
Матричные игры для двух игроков с нулевой и ненулевой суммой достаточно хорошо изучены и для них разработана теория оптимального поведения игроков.
Однако в жизненной практике в конфликтных ситуациях зачастую участвуют более чем две стороны. Чем больше игроков – тем больше проблем. Такие игры менее изучены и здесь есть просторное поле для новых фундаментальных научных исследований.
Несмотря на несколько легкомысленное звучание основных терминов, теория игр является строго научной дисциплиной с точными математическими выкладками.
На протяжении всего своего исторического пути развития человечество ежедневно сталкивается с конфликтными ситуациями: политическими, военными, экономическими, социальными и прочими, которые проявляются как в глобальных, так и в малых (вплоть до личных) формах. И если бы Человеку хватило бы ума в конфликтных ситуациях пользоваться не силой, не надеждой на "авось", а математикой, то жизнь наверняка была бы другой. Будем надеяться, что новое поколение, усвоив курс "Исследование операций" -, изменит жизнь к лучшему!
Итак, рассмотрим игру, в которой ЛПР противостоит "думающий" противник.
Возможны такие случаи:
1) Ходы игроками делаются одновременно.
2) Первым ходит игрок 2 – противник, но игрок 1 – ЛПР, не имеет информации о ходе противника.
3) Первым ходит игрок 2 – противник, но игрок 1 – ЛПР, знает о ходе противника.
4) Первым ходит игрок 1, но игрок 2 не имеет информации о ходе противника.
5) Первым ходит игрок 1, но игрок 2 знает о ходе противника.
Очевидно, что случаи 1), 2) и 4) идентичны – никто из игроков не знает о ходе противника ничего.
Рассмотрим случай 3). Так как ЛПР имеет полную информацию о ходе противника, то мы имеем ситуацию принятия решения в условиях полной определенности. Как уже отмечалось выше, такими задачами занимается математическое программирование.
Рассмотрим случай 5). Так как ЛПР ходит первым, то его противник наверняка выберет самую худшую для ЛПР стратегию. Поэтому в такой ситуации ЛПР необходимо принимать решение о своем ходе согласно принципу наибольшей осторожности, т.е. согласно принципу максимина. Это утверждение однозначно, легко математически доказывается и не должно подвергаться сомнению ни в каких жизненных ситуациях.
Итак, содержательны по своей сути только случаи 1), 2) и 4), которые сводятся к одному случаю. Это как мы видим, принятие решения в условиях неопределенности.
4.2 Матричные игры, разрешимые в чистых стратегиях
Рассмотрим парную конечную антагонистическую игру. Пусть игрок А располагает mличными стратегиями, которые обозначим А1, а2 ..., Аm. Пусть у игрока В имеется nличных стратегий, обозначим их В1, В2, ,.., Вn. Говорят, что игра имеет размерность mх n . В результате выбора игроками любой пары стратегий Аiи Вj(i = 1,2 …, m; j = 1,2, …, n).
Однозначно определяется исход игры, т.е. выигрыш аijигрока А (положительный или отрицательный) и проигрыш (-аij) игрока В . Предположим, что значения аijизвестны для любой пары стратегий (Аi Вj). Значения этих выигрышей заданы в платежной матрице
Строки этой таблицы соответствуют стратегиям игрока А , а столбцы – стратегиям игрока В .
С помощью хорошо нам знакомого принципа максимина найдем гарантированный наибольший выигрыш для игрока А:
Найденное число a называется нижней ценой игры.
Стратегия, соответствующая максимину, называется максиминной стратегией – она будет оптимальной стратегией игрока А.
Посмотрим на эту ситуацию с точки зрения второго игрока: ему необходимо уменьшить свои потери. В таком случае критерию максимина превратится в минимаксный и гарантированный наименьший проигрыш для игрока В будет таким:
Найденное число