Курсовая работа: Разработка и исследование способа обнаружения аномальных значений
(6)
где , и .
Определяются значения разности между исходным нестационарным случайным процессом и оценкой сглаживающих функций :
, .(7)
При оценке параметров разностного процесса на каждом интервале разбиения используется один из методов робастного оценивания [8], т.е. оценка параметров математического ожидания и среднеквадратического отклонения производится по -усеченной выборке. Для этого на каждом интервале разбиения получаем ряд ранжированных значений и оценку математического ожидания и среднеквадратического отклонения , которая проводится без учета первого и последнего значения ранжированного ряда. Тогда выражения для оценок математического ожидания и среднеквадратического отклонения принимают следующий вид [9]:
и ,(8)
где .Далее на каждом интервале разбиения исследуемого нестационарного случайного процесса устанавливается пороговое значение
, (9)
где – некоторый коэффициент, и . Превышение значений разностного процесса на каждом интервале разбиения установленного порогового значения (9) штрафуется, т.е. если выполняется условие:
, (10)
то получает одно штрафное значение. В соответствии с методом размножения оценок [4] вышеизложенная процедура определения штрафов повторяется р раз и для каждого повторения проверяется условие (10) для каждого значения , где ; ;; – объем выборки исследуемого нестационарного случайного процесса; – количество интервалов разбиения; – количество повторений процедур (2)–(10).
Таким образом, происходит накопление ряда штрафных значений для элементов исходной реализации исследуемого процесса, т.е.:
, (11)
где – ряд штрафных значений и ,.
По окончанию обработки для всех оштрафованных значений исходной реализации определяется суммарное значение штрафов и максимальное значение ряда . Далее проверяется условие: если
, (12)
то k -е значение из входной реализации нестационарного случайного процесса будет трактоваться как аномальное. Условие (12) получено на основе проведения имитационного моделирования при различных моделях полезной и шумовой составляющих нестационарного случайного процесса.
Для случая обнаружения аномальных значений в реализации нестационарного случайного процесса выбирать значение коэффициента только по оценкам среднеквадратического отклонения шумовой составляющей процесса является нецелесообразным, так как наличие аномальных значений существенно влияет на погрешность оценки полезной составляющей процесса и, как следствие, на оценку среднеквадратического отклонения разностного процесса. Следует также отметить, что на каждом интервале разбиения значение коэффициента не может быть фиксированным.
В связи с этим предлагается ввести адаптацию порогового значения о назначении штрафов (9) по коэффициенту относительно априорно фиксированного значения вероятности ошибки первого рода. С этой целью проведены исследования зависимости коэффициента от объема выборки , от значения среднеквадратического отклонения случайного процесса для различных стационарных процессов при априорно фиксированных значениях вероятности ошибки первого рода .
В результате получены зависимости выборочных значений коэффициента от объема исследуемой выборки и среднеквадратического отклонения шумовой составляющей процесса, то есть . Входная реализация представляет собой стационарный центрированный гауссовский случайный процесс. Исследования проводились на выборках объемом = 5, 7, 9, 11, 13 и 15 значений и среднеквадратическом отклонении случайного процесса = 0,1–0,5. В результате проведенных исследований были получены зависимости выборочных значений коэффициента при различных априорно фиксированных значениях вероятности ошибки первого рода . Усреднение значений коэффициента производилось по 1 000 выборок [10, 11, 12].
На рис. 1 приведены графики зависимости выборочных значений коэффициента для объема выборки и среднеквадратического отклонения случайного процесса при априорно фиксированных значениях вероятности ошибки первого рода (при =0,05 – рис. 1а, при =0,1 – рис. 1б).
а) б)
Рис. 1. Зависимость для гауссовского закона плотности распределения вероятности случайного процесса: а – при ; б – при
Из анализа полученных зависимостей, представленных на рис. 1, следует, что при различных фиксированных значениях вероятности ошибки первого рода с увеличением объема выборки выборочные значения коэффициента стремится к некоторому постоянному значению и практически не зависит от значения среднеквадратического отклонения случайного процесса. Выборочные значения коэффициента для выборок возрастают в среднем на 5 %.
Также приведены результаты исследований зависимости коэффициента от объема выборки и среднеквадратического отклонения , когда стационарный случайный процесс представлен равномерным и рэлеевским законами распределения. Результаты полученных зависимостей представлены на рис. 2а – для равномерного и на рис. 2б – для рэлеевского законов плотности распределения вероятности случайного процесса, при априорно фиксированном значении ошибки первого рода =0,05.
а) б)
Рис. 2. Зависимость при :