Курсовая работа: Принятие решений в условиях риска 3
Если, в частности, стратегия P = ( p1 , ..., pn ) является чистой стратегией А k , k = l, ..., m , то pi = 0 i ≠ k, pk = 1, и ее показатель эффективности как смешанной стратегии , превращается в ее показатель эффективности как чистой стратегии ā k , вычисляемый по формуле (6).
Пусть SA - множество всех смешанных (в том числе и чистых) стратегий игрока A. Оптимальной среди всех стратегий множества SA по критерию Байеса относительно выигрышей назовем стратегию P 0 , показатель эффективности (9) которой максимален:
max =
. (10)
P ϵ S a
Стратегия А i 0 оптимальная среди чистых стратегий по критерию Байеса относительно выигрышей, является оптимальной по тому же критерию и среди всех смешанных стратегий множества SA .
При принятии решений в условиях риска по критерию Байеса относительно выигрышей можно обойтись только чистыми стратегиями, не используя смешанные.
1.4 Критерий Байеса относительно рисков
Рассмотрим ту же игру с природой матрицей, в которой известны вероятности состояний природы q1 , ..., qn . При принятии решений в условиях риска можно пользоваться не только средними выигрышами, но и средними рисками. Составим матрицу рисков для матрицы A , используя формулу рисков (3)
Таблица 3 – Матрица рисков
П j А i | П 1 | П 2 | … | П n |
А1 | r11 | r12 | … | r1n |
А2 | r21 | r22 | … | r2n |
… | … | … | … | … |
А m | rm1 | rm2 | … | rmn |
Показателем неэффективности стратегии А i по критерию Байеса относительно рисков называется среднее значение, или математическое ожидание риска i-й строки матрицы (таблица 3), вероятности которых, очевидно, совпадают с вероятностями состояний природы. Обозначим средний риск при стратегии А i через ṝi , тогда
ṝi = q1 ri1 + q2 ri2 + … + qn rin =
, i= 1, …, m. (11)
является взвешенной средней рисков i -й строки матрицы (таблица 3) с весами pi , i =1, ..., т.
Оптимальной среди чистых стратегий по критерию Байеса относительно рисков является стратегия П j , показатель неэффективности (11) которой минимален, т.е. минимален средний риск
ṝi0 = min ṝi . (12)
1≤ i ≤ m
Определим понятие риска при использовании игроком А смешанной стратегии и при состоянии природы П j , j = l, ..., п , как разность
r (P , П j ) = [max H (U , П j )] - H (P , П j ), j =1, …, n. (13)
U ϵ S a
между максимальным выигрышем max H (U , П j ) при всех смешанных стратегиях U = ( u1 , ..., un ) ϵ SA и при состоянии природы П j и выигрышем H (P , П j ) при смешанной стратегии P = ( p1 , ..., pn ) и при состоянии природы П j .
В качестве показателя неэффективности смешанной стратегии P = ( p1 , ..., pn ) по критерию Байеса относительно рисков рассмотрим взвешенную среднюю рисков (13) с весовыми коэффициентами, равными вероятностям q1 , ..., qn состояний природы:
=
. (14)
Оптимальной среди всех смешанных (в том числе и чистых) стратегий по критерию Байеса относительно рисков будем считать стратегию P 0 , показатель неэффективности которой, вычисляемый по формуле (14), минимален:
min =
. (15)
P ϵ S a
Если А i 0 - стратегия, оптимальная среди чистых стратегий по критерию Байеса относительно рисков, то она является оптимальной по тому же критерию и среди всех смешанных стратегий множества SA .
При принятии решения в условиях риска по критерию Байеса относительно рисков так же как и в случае критерия Байеса относительно выигрышей достаточно использовать одни чистые стратегии, не рассматривая смешанные.
Критерии Байеса относительно выигрышей и относительно рисков эквивалентны, т.е. если стратегия А i 0 является оптимальной по критерию Байеса относительно выигрышей, то она является оптимальной и по критерию Байеса относительно рисков, и наоборот, стратегия А i 0 , оптимальная по критерию Байеса относительно рисков, оптимальна и по критерию Байеса относительно выигрышей.
1.5 Критерий Лапласа относительно выигрышей
В предыдущих двух критериях Байеса известные вероятности q1 , ..., qn состояний природы могли быть получены из статистических данных, отражающих многократное решение подобных задач, или в результате наблюдений за поведением природы. Однако, довольно часто складывается такая ситуация, когда мы лишены возможности определить вероятности состояний природы указанными способами. Желая все же принять решение в условиях риска, мы вынуждены оценить вероятности состояний природы субъективно. Существуют различные методы численной субъективной оценки степени правдоподобности состояний природы. Один из них состоит в том, что мы не можем отдать предпочтение ни одному из состояний природы, и потому считаем их равновероятными, т.е. q1 = .. .=qn = . Этот принцип называется «принципом недостаточного основания» Лапласа. На нем основан критерий Лапласа относительно выигрышей.
Показателем эффективности стратегии А i по критерию Лапласа относительно выигрышей называется среднее арифметическое выигрышей i -й строки:
ā i = , i = 1, …, m . (16)