Курсовая работа: Анализ эмпирического распределения
Для расчёта квартилей применяются следующие формулы:
1) для несгруппированных данных:
Нижний (первый) квартиль (Lower quartile):
, , (4.1)
Верхний (третий) квартиль (Upper quartile):
, , (4.2)
2) в интервальном вариационном ряду распределения:
(4.3)
(4.4)
где:Q1 и Q3 – нижний и верхний квартили; , – нижние границы квартильных интервалов; h – величина группировочного интервала; – абсолютные частоты квартильных интервалов; – накопленные (кумулятивные) частоты интервалов, предшествующих квартильным.
Рассчитаем квартили распределения на основе сгруппированных данных (табл. 4.1).
Таблица 4.1 Исходные данные для расчета квартилей распределения регионов России по количеству легковых автомобилей на 1000 чел. населения за 2005 г.
Интервал | Абсолютная частота (fi ) | Кумулятивная частота (Fi ) |
19,31429-49,68571 | 2 | 2 |
49,68571-80,05714 | 3 | 5 |
80,05714-110,4286 | 6 | 11 |
110,4286-140,8 | 15 | 26 |
140,8-171,1714 | 32 | 58 |
171,1714-201,5429 | 13 | 71 |
201,5429-231,9143 | 4 | 75 |
231,9143-262,2857 | 5 | 80 |
Итого: | 80 | – |
Нижний квартиль распределения равен:
Верхний квартиль распределения:
Квартили, рассчитанные с помощью программы Statistica, немного отличаются от тех, что рассчитаны вручную по сгруппированным данным:
· Нижний квартиль равен 135,85.
· Верхний квартиль – 172,75.
5. ХАРАКТЕРИСТИКА ФОРМЫ РАСПРЕДЕЛЕНИЯ
Для дальнейшего изучения характера вариации используются средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины.
Эти показатели получили название центральных моментов распределения порядка, соответствующего степени, в которую возводятся отклонения (табл. 5.1), или просто моментов.
Таблица 5.1 Формулы для расчета центральных моментов
Порядок момента | Формулы для расчета | |
для несгруппированных данных | для сгруппированных данных | |
Первый | ||
Второй | ||
Третий | ||
Четвертый |
Согласно свойству средней арифметической центральный момент первого порядка равен нулю, второй центральный момент представляет собой дисперсию. Третий центральный момент используется для оценки асимметрии распределения, четвертый – для оценки эксцесса.
На основе момента третьего порядка можно построить показатель, характеризующий степень асимметричности распределения:
(5.1)
Этот показатель называют коэффициентом асимметрии. Он может быть рассчитан как по сгруппированным, так и по несгруппированным данным.
С помощью момента четвертого порядка характеризуется свойство рядов распределения, называемое эксцессом. Показатель эксцесса рассчитывается по формуле:
(5.2)