Курсовая работа: Ігри з природою
2. Критерій мінімаксного ризику Севіджа.
Поняття ризику виявляється корисним і для введення інших принципів поведінки в іграх з природою. На ньому, зокрема, заснований критерій Севіджа, відповідно до якого в умовах невизначеності (вірогідність станів природи невідома) слід вибирати таку стратегіюi 0 , яка гарантує мінімальний ризик, тобто
Цей критерій — теж украй песимістичний, але при виборі оптимальної стратегії радить орієнтуватися не на виграш, а на ризик. Сутність такого підходу в тому, щоб всіляко уникати великого ризику при ухваленні рішення. В значенні «песимізму» критерій Севіджа схожий з критерієм Вальда, але самий «песимізм» тут розуміється по-іншому.
Покажемо на прикладі, що критерій Севіджа, взагалі кажучи, відрізняється від критерію Вальда. Розглянемо матрицю:
Для неї оптимальною по Вальду є перша стратегія:
.
Відповідна матриці А матриця ризику є:
Оптимальною по Севіджу тут є друга стратегія:, тобто критерії Вальда і Севіджа в даному прикладі приводять до різних результатів (хоча можна навести і приклади, в яких виходять однакові результати).
3. Критерій песимізму-оптимізму Гурвіца. Цей критерій рекомендує при виборі рішення не керуватися ні крайнім песимізмом, ні крайнім, легковажним оптимізмом. Згідно цьому критерію вибирається стратегія з умови
де — «коефіцієнт песимізму», вибраний між нулем і одиницею.
При = 1 критерій Гурвіца перетворюється на критерій Вальда; при = 0 — в критерій «крайнього оптимізму», що рекомендує вибрати ту стратегію, при якій найбільший виграш в рядку максимальний. При 0 < < 1 виходить щось середнє між тим і іншим. Коефіцієнт вибирається з суб'єктивних міркувань — чим небезпечно ситуація, чим більше ми хочемо в ній «підстрахуватися», чим менша наша схильність до ризику, тим ближче до одиниці вибирається .
При бажанні можна побудувати критерій, аналогічний Н, виходячи не з виграшу, а з ризику, але ми на цьому не зупинятимемося.
На перший погляд здається, що вибір критерію — суб'єктивний, вибір коефіцієнта — теж суб'єктивний, значить і рішення теж приймається суб'єктивно, тобто, грубо кажучи, довільно.
В якійсь мірі це дійсно так — вибір рішення в умовах невизначеності завжди умовний, суб'єктивний. Та все ж в якійсь (обмеженої) мірі математичні методи корисні і тут. Перш за все, вони дозволяють привести гру з природою до матричної форми, що далеко не завжди буває просто, особливо коли стратегій багато (в наведених прикладах їх було дуже мало). Крім того, вони дозволяють замінити просту матрицю виграшів (або ризиків), послідовним чисельним аналізом ситуації з різних точок зору, вислухати рекомендації кожній з них і, нарешті, зупинитися на чомусь визначеному. Це аналогічно обговоренню питання з різних позицій, а в суперечці, як відомо, народжується істина. Отже не слід чекати від теорії рішень остаточних, незаперечних рекомендацій — єдине, чим вона може допомогти — це порадою.
Якщо рекомендації, витікаючі з різних критеріїв, співпадають — тим краще, значить, можна сміливо вибрати рішення, що рекомендується: воно швидше за все не «підведе». Якщо ж, як це часто буває, рекомендації суперечать один одному, то треба з'ясувати, наскільки до різних результатам вони приводять, уточнити свою точку зору і провести остаточний вибір. Не треба забувати що в будь-яких задачах в обгрунтовуванні розв’язків деяке свавілля неминуче — хоча б при побудові математичної моделі, виборі показника ефективності. Вся математика, вживана в дослідженні операцій, не відміняє цього свавілля, а дозволяє тільки «поставити його на своє місце».
Розглянемо елементарний приклад «гри з природою» 4 3, матриця виграшів якої () дана в таблиці 1.3.5.
Таблиц я 1.3.5
Виберемо оптимальну стратегію користуючись критеріями Вальда, Севіджа і Гурвіца, причому в останньому візьмемо = 0,6 (перевага трохи у бік песимізму).
1. Застосуємо критерій Вальда. Підрахуємо мінімуми по рядках (див. таблицю 1.3.6) і виберемо ту стратегію, при якій мінімум рядка максимальний (рівний 25). Це — стратегія A3 .
Таблиц я 1.3.6
|
2. Застосуємо критерій Севіджа. Перейдемо від матриці виграшів (таблиця 1.3.6) до матриці ризиків (таблиця 1.3.7), в правому додатковому стовпці запишемо максимальне в рядку значення ризику .
З чисел правого стовпця мінімальне (60) відповідає стратегіям А2 і Аз; значить, обидва вони оптимальні по Севіджу.
Таблиц я 1.3.7
|
3. Застосуємо критерій Гурвіца (при = 0,6). Знову перепишемо таблицю 1.3.5, але цього разу в правих трьох додаткових стовпцях поставимо: мінімум рядка , його максимум , і величину , округлену до цілих одиниць (див. таблицю 1.3.8). Максимальне значення hi =47 відповідає стратегії А3 .
Отже, в даному випадку всі три критерії однозначно говорять на користь стратегії А3 , яку є всі підстави вибрати.