Курсовая работа: Принятие решений в условиях риска 3
представляющую собой наименьший выигрыш игрока А при состоянии природы П j . Тогда имеем:
rij ≤ β j - ω j , i= 1, …, m ; j =1, …, n. (5)
Разность β j - ω j естественно назвать колебанием выигрышей при состоянии природы П j , j = l, ..., п
Если aij = β j , то rij = 0, т.е. стратегия А i при состоянии природы П j является безрисковой.
Если aij = ω j , то риск rij , является максимальным. Следовательно, по критерию риска стратегия А i в этом случае наихудшая.
Если β j = ω j , то все выигрыши j -столбце матрицы игры равны между собой: ω j = a 1 j = a 2 j = … = amj = β j и риск rij = 0. Поэтому в этом случае любая стратегия игрока А при состоянии природы П j безрисковая.
Для матрицы А матрица рисков RA имеет ту же размерность и следующий вид:
Таблица 2 – Матрица рисков
RA = | П j А i | П 1 | П 2 | … | П n |
А1 | r11 | r12 | … | r1n | |
А2 | r21 | r22 | … | r2n | |
… | … | … | … | … | |
А m | rm1 | rm2 | … | rmn |
Отметим, что матрица выигрышей А однозначно порождает матрицу рисков RA , поскольку каждый риск rij однозначно определяется соответствующими показателем благоприятности β j состояния природы П j , и выигрышем aij . Обратное неверно: одна и та же матрица рисков может соответствовать разным матрицам выигрышей.
В понятии оптимальной стратегии лежат различные соображения, составляющие содержание соответствующих критериев оптимальности стратегий.
Перед тем как переходить к выбору оптимальной стратегии, целесообразно возможности упростить матрицу А, уменьшив число строк на основании принципа доминирования стратегий игрока А.
1.2 Упрощение матрицы игры
Если какая-нибудь из стратегий игрока А окажется доминирующей каждую из остальных его стратегий, то она и должна выбираться игроком А в качестве предпочтительной, поскольку его выигрыш при этой стратегии и при любом состоянии природы П не меньше выигрыша при любой из остальных стратегий.
Если же матрица игры не обладает указанным свойством, т.е. у игрока А нет стратегии, доминирующей каждую из остальных его стратегий, то нужно посмотреть, нет ли у него доминируемых или дублирующих стратегий. При наличии таковых, соответствующие им строки матрицы можно удалить, уменьшив тем самым ее размерность.
Таким образом, в играх с природой можно и полезно пользоваться принципом доминирования стратегий игрока А (строк матрицы игры). Однако принцип доминирования стратегий (состояний) природы (столбцов матрицы игры) недопустим, поскольку природа не выбирает свои состояния с целью по возможности большего уменьшения выигрышей игрока А, для нее нет более или менее эффективных состояний.
1.3 Критерий Байеса относительно выигрышей
Предположим, что статистик из прошлого опыта известны не только состояния П j , j = l, ..., п , в которых может находиться природа П , но и соответствующие вероятности q1 , ..., qn с которым природа П реализует эти состояния. Тогда мы находимся в ситуации принятия решения в условиях риска.
Показателем эффективности стратегии Аi по критерию Байеса относительно выигрышей называется среднее значение, или математическое ожидание выигрыша i-й строки с учетом вероятностей всех возможных состояний природы. Обозначая это среднее значение через ā i , будем иметь:
ā i = q1 ai 1 + q2 ai 2 + … + qn ain = , i = 1, …, m . (6)
Таким образом, at представляет собой взвешенное среднее выигрышей i-й строки, взятых с весами q1 , ..., qn .
Оптимальной среди чистых стратегий по критерию Байеса относительно выигрышей считается стратегия Аi 0 с максимальным показателем эффективности, т.е. с максимальным средним выигрышем:
āi0 = max āi . (7)
1≤ i ≤m
Таким образом, выбранное решение по этому критерию является оптимальным не в каждом отдельном случае, а в среднем.
Распространим понятие показателя эффективности по критерию Байеса относительно выигрышей на смешанные стратегии игрока П .
Пусть P = ( p1 , ..., pn ) - некоторая смешанная стратегия игрока А, при которой чистая стратегия Аi используется им с вероятностью pi , i =1, ..., т. Тогда выигрыш игрока А при смешанной стратегии P = ( p1 , ..., pn ) и при состоянии природы П j будет равен
H (P , П j ) = , j =1, …, n. (8)
Показателем эффективности смешанной стратегии P = ( p1 , ..., pn ) по критерию Байеса относительно выигрышей назовем среднее значение выигрышей, с учетом вероятностей q1 , ..., qn состояний природы. Обозначим этот показатель через .
Получим:
=
=
=
=
. (9)