Курсовая работа: Анализ эмпирического распределения

Таблица 5.2 Расчет ассиметрии и эксцесса для распределения регионов России по количеству легковых автомобилей на 1000 чел. населения за 2005 г.

Интервал Абсолютная частота (fi ) Середина интервала (xi )
19,31429-49,68571 1 34,5 -3323682,13 393685400,9
49,68571-80,05714 3 58,12 -2049797,54 180540318,8
80,05714-110,4286 3 81,74 -1152941,93 66531323,0
110,4286-140,8 5 105,365 -306347,11 8373775,1
140,8-171,1714 14 128,99 896,48 2722,7
171,1714-201,5429 28 152,61 484749,46 16194790,2
201,5429-231,9143 14 176,23 1037801,06 66190981,2
231,9143-262,2857 6 199,855 4173022,64 392896041,5
Итого: 80 -1136299,06 1124415353,4

Коэффициент ассиметрии по сгруппированным данным:

Коэффициент ассиметрии на основе исходного ряда данных был рассчитан с помощью ППП Statistica и составил -0,341.

Коэффициент эксцесса на основе сгруппированных данных:

Коэффициент эксцесса, рассчитанный для несгруппированных данных, составил 1,075.

Сопоставим показатели, рассчитанные вручную по сгруппированным данным, и показатели, полученные с помощью программы Statistica на основе исходного ряда данных (табл. 5.3).

Таблица 5.3 Сравнение статистических показателей, рассчитанных различными способами

Название показателя Значение в ППП Statistica Значение после ручного расчета
1. Средняя арифметическая 153,055 152,95
2. Медиана 153,45 154,09
3. Мода 161,70 155,14
4. Дисперсия 1730,257 1973,99
5. Нижний квартиль 135,85 128,65
6. Верхний квартиль 172,75 175,84

6. СГЛАЖИВАНИЕ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ.

ПРОВЕРКА ГИПОТЕЗЫ О ЗАКОНЕ РАСПРЕДЕЛЕНИЯ

Одна из важнейших задач анализа вариационных рядов заключается в выявлении закономерности распределения и определении ее характера. Основной путь в выявлении закономерности распределения – построение вариационных рядов для достаточно больших совокупностей. Важное значение для выявления закономерности распределения имеет правильное построение самого вариационного ряда: выбор числа групп и размера интервала варьирующего признака.

Говоря о характере, типе закономерности распределения, имеем в виду отражение в нем общих условий вариации. При этом речь всегда идет о распределениях качественно однородных явлений. Общие условия, определяющие тип закономерности распределения, познаются анализом сущности явления, тех его свойств, которые определяют вариацию изучаемого признака. Следовательно, должна быть выдвинута какая-то научная гипотеза, обосновывающая тип теоретической кривой распределения.

Под теоретической кривой распределения понимается графическое изображение ряда в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариантов (значений признака).

Теоретическое распределение может быть выражено аналитически – формулой, которая связывает частоты вариационного ряда и соответствующие значения признака. Такие алгебраические формулы носят название законов распределения[6] .

Процедура выравнивания, сглаживания анализируемого распределения заключается в замене эмпирических частот теоретическими, определяемыми по формуле теоретического распределения, но с учетом фактических значений переменной. На основе сопоставления эмпирических и теоретических частот рассчитываются критерии согласия, которые используются для проверки гипотезы о соответствии исследуемого распределения тому или иному типу теоретического распределении.

Для проверки статистической гипотезы о законе распределения будем использовать критерий – критерий Пирсона (Chi-square test). Расчет критерия производится по следующей формуле:

(6.1)

где: – эмпирические абсолютные частоты (Observed Frequency); – абсолютные частоты теоретического распределения (Expected Frequency); k – число интервалов.

С помощью ППП Statistica проведем сглаживание рассматриваемого распределения и проверим статистическую гипотезу о законе распределения.

Рис. 6.1. Проверка гипотезы о нормальном распределении переменной Var1


Для сглаживания эмпирического распределения переменной Var1 нормальным распределением необходимо использовать формулы, приведенные ниже.

Функция нормального распределения:

(6.2)

Плотность нормального распределения определяется по формуле:

(6.3)

где:х – значение изучаемого признака; – средняя арифметическая величина; – среднее квадратическое отклонение изучаемого признака; – математические константы; – нормированное отклонение.

Теоретические частоты нормального распределения рассчитываются по следующей формуле:

К-во Просмотров: 380
Бесплатно скачать Курсовая работа: Анализ эмпирического распределения