Реферат: Методы решения биматричных игр

Рассмотрим конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей линии поведения:

игрок А – может выбрать любую из стратегий А1 , ... , Ат ,

игрок В – любую из стратегий В1 , …, В n

При этом всякий раз их совместный выбор оценивается вполне определенно:

если игрок А выбрал i -ю стратегию , а игрок В – k стратегию , то в итоге выигрыш игрока А будет равен некоторому числу , а выигрыш игрока В некоторому, вообще говоря, другому числу .

Иными словами, всякий раз каждый из игроков получает свой приз.

Последовательно перебирая все стратегии игрока А и все стратегии игрока В, мы сможем заполнить их выигрышами две таблицы (первая из них описывает выигрыши игрока А, а вторая – выигрыши игрока В).

Обычно эти таблицы записывают в виде матриц


Здесь А – платежная матрица игрокаА , а В – платежная матрица игрокаВ .

При выборе игроком А i -й стратегии, а игроком В k -й стратегии их выигрыши находятся в матрицах выплат на пересечении i -х строк и k -x столбцов: в матрице А это элемент , а в матрице В – элемент .

Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны), получаются две платежные матрицы: одна – матрица выплат игроку А , другая – матрица выплат игроку В . Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре – биматричная .

Замечание. Рассматриваемые матричные игры, можно рассматривать и как биматричные, где матрица выплат игроку В противоположна матрице выплат А :

В общем случае биматричная игра – это игра с ненулевой суммой .

Класс биматр. игр значительно шире класса матричных (разнообразие новых моделируемых конфликтных ситуаций весьма заметно), а, значит, неизбежно увеличиваются и трудности, встающие на пути их успешного разрешения.

Пример. «Студент — Преподаватель».

Рассмотрим следующую ситуацию. Студент (игрок А ) готовится к зачету, который принимает Преподаватель (игрок В ). Можно считать, что у Студента две стратегии – подготовиться к сдаче зачета (+) и не подготовиться (-). У Преподавателя также две стратегии – поставить зачет [+] и не поставить зачета [-].

В основу значений функций выигрыша игроков положим следующие соображения:

Количественно это можно выразить, например, так

2. Смешанные стратегии в биматричных играх

В приведенных примерах описаны ситуации, в которых интересы игроков не совпадают. Встает вопрос о том, какие рекомендации необходимо дать игрокам для того, чтобы моделируемая конфликтная ситуация разрешилась. Иными словами, что мы будем понимать под решением биматричной игры?

Попробуем ответить на это вопрос так:

вследствие того, что интересы игроков не совпадают, нам нужно построить такое (компромиссное) решение, которое бы в том или ином, но в одинаковом смысле удовлетворяло обоих игроков.

Не пытаясь сразу выражать эту мысль совсем точно, скажем – попробуем найти некую равновесную ситуацию , явное отклонение от которой одного из игроков уменьшало бы его выигрыш.

Подобный вопрос мы ставили и при рассмотрении матричных игр. Напомним, что возникающее при разработке минимаксного подхода понятие равновесной ситуации приводило нас к поиску седловой точки, которая, существует не всегда – конечно, если ограничиваться только чистыми стратегиями игроков А и В , т.е. стратегиями .

Однако при расширении матричной игры путем перехода к смешанным стратегиям, т. е. к такому поведению игроков, при котором они чередуют (чистые) стратегии с определенными частотами:

игрок А стратегии A 1 ,..., Ат с частотами р1 ,..., рт , где

а игрок В стратегии В1 ,...., В n , с частотами q 1 ,..., qn , где

выяснилось, что в смешанных стратегиях равновесная ситуация всегда существует. Иными словами, любая матричная игра в смешанных стратегиях разрешима .

Поэтому, рассматривая здесь биматричные игры, разумно попробовать сразу же перейти к смешанным стратегиям игроков (этим мы предполагаем, что каждая игра может быть многократно повторена в неизменных обстоятельствах).

В матричном случае смешивание стратегий приводило к расширению возможности выплат в том смысле, что расчет строился из вычисления средних выигрышей игроковА иВ , которые определялись по элементам платежной матрицы А и вероятностям и :

,

--> ЧИТАТЬ ПОЛНОСТЬЮ <--

К-во Просмотров: 267
Бесплатно скачать Реферат: Методы решения биматричных игр