Курсовая работа: Застосування експертних систем у медицині

У результаті аналізу статистичної залежності іридоознак можна зазначити, що:

між іридоознаками існує статистична залежність, яка має два основних механізми -"фізіологічний" і "математичний". У першому випадку залежність зумовлена або проявом одного і того самого захворювання у вигляді декількох ознак, або проявом ознак декількох залежних захворювань, в другому випадку це залежність між комплексною іридоознакою, утвореною сукупністю елементарних іридоознак, та елементарними іридоознаками, які входять до її складу;

на сьогодні найбільше вивчена залежність між різними іридоознаками та ознакою "колір райдужної оболонки", що, очевидно, пояснюється не стільки інформативністю ознаки "колір райдужної оболонки", скільки простотою та легкістю його оцінювання.

Можна назвати основні чинники фізичної природи статистичної залежності ознак:

каузальність (причинно-наслідкова залежність);

синхронізм

У першому випадку поява ознаки X зумовить іздеякою ймовірністю появу іншої ознаки Y. У другому випадку передбачають наявність третьої, прихованої від спостереження (латентної) або просто ігнорованої, події Z, каузально зв'язаної з ознаками X і Y, які в результаті такого зв'язку стають статистично залежними.

Для оцінки характеру та міри статистичної залежності ознак X і Y можна застосовувати поняття регресії і коефіцієнтів регресії. Регресією Y на X називається умовне математичне очікування (MO) випадкової величини (ВВ) Y для фіксованого значення Х=х:

E{Y(x)}=E{Y/X = x}.

Лінією регресії Y на X називається MO, що розглядається як функція змінної х. Аналогічно визначається регресія X на Y. Лінії регресії Y на X та Х на Y не збігаються. Регресія називається лінійною, якщо лінія регресії пряма. Для незалежних ВВ лінії регресії перетворюються в прямі, паралельні до координатних осей.

Якщо позначити колір райдужної оболонки символом X, а тип райдужної оболонки — символом Y, то можна розглядати значення умовної густини P(Y/X). Враховуючи суттєву нерівномірність цієї функції Y (для фіксованих значень X) можна наближено оцінити її середнє значення (математичне очікування) - йому відповідає максимум густини P(Y/X) як функції Y.

Характер статистичної залежності між ознаками може бути як лінійним, так і нелінійним. Для лінійної залежності використовується поняття "коефіцієнт кореляції"

rXY = Е{(Х - Е{ X})(Y - E{Y})} / axay,

де axay -середньоквадратичні відхилення ВВ X і У:

rXY =E{(X-E{X})(Y-E{Y})}/ axay.

У загальному випадку |rXY|<1 - Рівність rXY=0 має місце для некорельованих (і незалежних - у випадку нормально розподілених X та Y) ВВ, а |rXY|=1 — для лінійно залежних детермінованих ВВ.

Неповнота апріорних даних. Інша суттєва перешкода для використання формули Байєса полягає в необхідності знання апріорних імовірностей P(Yj) захворювань Yj. Якщо ця інформація відсутня, можна вважати всі гіпотези рівноймовірними, тобто P(Yj)=1/J, де У - кількість альтернативних захворювань.

Однак це може привести або до недостатньо високої вірогідності висновків (у випадку фіксованої кількості іридоознак, що спостерігаються), або буде вимагати збільшення обсягу спостережень (у випадку фіксованої досить високої вірогідності висновків).

Як приклад розглядається спроба використання у формулі Байєса статистичної інформації про деякі ознаки ниркової патології, зокрема такої інформації: "...Характерним для ниркової патології симптомом був лімфатичний розарій, який виявляли в обстежуваних хворих у 57% випадків... При захворюваннях легень, шлунково-кишкового тракту, серцево-судинної і нервової систем лімфатичний розарій виявляли рідше, ніж при захворюваннях нирок у 9-22% випадків... Вказана обставина дозволяє лікарю міркувати так: у випадку будь-якого виявлення лімфатичного розарію на райдужній оболонці можна передбачити, але в жодному разі не можна стверджувати, що у цього хворого є зміни стосовно нирок".

У розглянутому випадку не враховується частота зустрічі ниркової патології взагалі, безвідносно до будь-якої сукупності діагностичних ознак, отже апріорні ймовірності гіпотез Y1 ”є захворювання нирок" і Y2 ”немає захворювання нирок" можна прийняти однаковими: Р(Y1)-Р(Y2)=0,5.

Припустимо, що мають місце такі умовні ймовірності Р(Х/Yj):

Р(ХІ/Y1) = 0,57; Р(Х1/Y2) = 0,155,

Де X1означає "є лімфатичний розарій", а значення величини Р(Х1/Y2) = 0,155отримано як середнє арифметичне значення 0,09 і 0,22 (9-22%).

Згідно з (1.1),

(1.2)

Оскільки

(1.3)

З (1.2) випливає:

К-во Просмотров: 192
Бесплатно скачать Курсовая работа: Застосування експертних систем у медицині