Реферат: Непараметричні методи розпізнавання з гарантованим рівнем значущості
Апробація результатів дисертації. Основні положення та результати наукових досліджень, що увійшли до дисертації, доповідалися на таких наукових конференціях, симпозіумах та семінарах: міжнародна конференція “Functional Analysis, Operator Theory, Stochastic Analysis and Statistics” (2001, Kyiv), міжнародна конференція “Моделювання та оптимізація складних систем” (2001, Київ), десята міжнародна наукова конференція імені академіка М. Кравчука (2004, Київ,), 27th International Conference on Information Technology Interfaces, ITI (2005, Cavtat, Chroatia), International Conference of Mathematics and Engineering techniques in Medicine and Biological Sciences (Las Vegas, 2001–2005), Conference on Bioinformatics & Computational Biology (2006, Las Vegas), International Conference on Scientific Computing (2007, Las Vegas).
Матеріали дисертаційного дослідження доповідалися та обговорювалися на науковому семінарі Київського національного університету імені Тараса Шевченка “Оптимальне керування лінійними розподіленими системами” (керівник проф. С.І. Ляшко), на науковому семінарі Міжнародного науково-навчального центру інформаційних технологій і систем НАН України і МОН України (керівник - канд. техн. наук В.І. Гриценко), на науковому семінарі відділу математичних методів дослідження операцій Інституту кібернетики ім.В.М. Глушкова НАН України (керівник – проф.П.С. Кнопов) і на науковому семінарі відділу теорії випадкових процесів Інституту математики НАН України (керівник – проф.А. А. Дороговцев).
Публікації. Основні результати дисертаційної роботи викладено у трьох монографіях [1–3], 32 статтях [4–35], із них 24 - у наукових провідних фахових виданнях України, що входять до переліку ВАК по фізико-математичних науках, та 8 - у виданнях інших країн. Результати роботи захищені трьома патентами на винахід [36–38] і опубліковані в збірках тез 8 наукових конференцій [39–46].
Структура та обсяг роботи. Дисертаційна робота складається із вступу, семи розділів, висновків та списку використаних джерел, що містить 324 посилання. Кожний розділ розбито на підрозділи, які, у свою чергу, поділяються на пункти. Кожний розділ має власну нумерацію формул, теорем, лем, зауважень тощо. Загальний обсяг дисертації становить 278 стор., основний текст роботи викладено на 249 стор.
ОСНОВНИЙ ЗМІСТ
У вступі обґрунтовано актуальність роботи, сформульовано основні задачі та об’єкти дослідження, а також відзначено наукову новизну результатів. Перший розділ містить огляд літератури за темою дисертації та обґрунтування вибору напрямків досліджень.
У другому розділі розроблена структурна модель випадкового експерименту і введено її основні поняття.
Третій розділ присвячений доведенню гіпотези Хілла та побудові і дослідженню непараметричного критерію еквівалентності генеральних сукупностей на основі мір близькості між вибірками, які ґрунтуються на гіпотезі Хілла.
Четвертий розділ присвячений побудові довірчих інтервалів із гарантованим рівнем значущості в класичній і узагальненій моделях Бернуллі, а також відповідних статистичних критеріїв для перевірки гіпотези про еквівалентність функцій розподілу.
У п’ятому розділі викладено суть стратифікаційного аналізу генеральних сукупностей, задача якого полягає у визначенні кількості мод функції розподілу та їх параметрів на підставі кусково-лінійної емпіричної функції розподілу.
У шостому розділі викладено нову концепцію узагальненого розв’язку операторних рівнянь у метричних просторах.
В сьомому розділі описано застосування непараметричних методів розпізнавання з гарантованим рівнем значущості, запропонованих у дисертації: 1) нового комп’ютерного методу раннього розпізнавання раку молочної залози, 2) методу ретроспективного регресійного аналізу ступеня прогностичної значущості клінічних, цитогенетичних і морфологічних показників у хворих із злоякісною меланомою, 3) методу сплайнової регресії для виявлення залежності імовірності виникнення злоякісних новотворів від поглиненої дози опромінення, отриманої учасниками ліквідації наслідків аварії на ЧАЕС; 4) методу стратифікаційного аналізу популяцій радіо - та хіміорезистентних пухлин.
ВИСНОВКИ
У дисертації розроблені, теоретично обґрунтовані і застосовані на практиці нові непараметричні методи розпізнавання з гарантованим рівнем значущості, які у сукупності розв’язують важливу наукову проблему комп’ютерної ранньої діагностики онкологічних захворювань та статистичного аналізу популяцій радіо - та хіміорезистентних ракових клітин. Це включає в себе такі результати.
Запропоновано структурну модель випадкового експерименту на основі інтерпретації поля випадкових подій як напівупорядкованої множини з природним відношенням упорядкованості між випадковими подіями. Зокрема,
показано, що поле подій являє собою атомарно породжену повну цілком дистрибутивну булеву алгебру;
вивчено розподіл ймовірностей поля подій, породжений випадковими величинами;
установлено, що у випадку неперервних випадкових величин (як раціональних, так і дійсних) породжуваний ними розподіл ймовірностей не є злічено-адитивною функцію подій.
Доведено гіпотезу Хілла для симетрично залежних випадкових величин із абсолютно неперервною функцією розподілу. Проведено теоретичне обґрунтування алгоритму побудови довірчих еліпсів на основі гіпотези Хілла та запропоновано його модифікацію.
Розроблено непараметричні критерії еквівалентності генеральних сукупностей на основі мір близькості між гіпотетичними і емпіричними вибірками із неперервної або дискретної генеральної сукупності, що складаються із симетрично залежних вибіркових величин. Доведено їх перевагу над статистиками Колмогорова-Смірнова і Вілкоксона. Зокрема, показано, що для p-статистики можна побудувати наближені довірчі межі, що відповідають заданому рівню значущості у випадку, коли нульова гіпотеза H не є вірною;
доведено, що p-статистика є більш ефективною при перевірці гіпотези про еквівалентність генеральних сукупностей з однаковими чи близькими математичними сподіваннями;
продемонстровано, що p-статистика має високий поріг чутливості у всіх проаналізованих прикладах вибірок з різних генеральних сукупностей;
показано, що атомарна міра близькості є найбільш стійкою до коливань об’ємів вибірок, забезпечуючи при цьому високий рівень розпізнавання.
Розроблено нові статистичні критерії для порівняння двох ймовірностей в класичній і узагальненій схемах Бернуллі. Зокрема,
досліджено правило 3s для залежних спостережень;
розроблено метод обчислення довірчих меж для невідомої ймовірності в MП-моделі;
розроблено метод обчислення точних довірчих меж для невідомої ймовірності в узагальненій моделі Бернуллі.
Розроблено нові методи стратифікаційного аналізу генеральних сукупностей. Зокрема,
доведено аналог теореми Глівенка–Кантеллі для обернених модифікованих функцій розподілу і на її підставі запропоновано новий критерій одномодальності функції розподілу;
запропоновано новий метод розпізнавання складених або змішаних вибірок;
доведено практичну доцільність та обґрунтованість розробленого методу.