Курсовая работа: Статистический анализ образования
Медианой ( M е ) в статистике называют такое значение варьирующего признака, которое делит ряд распределения на две равные части по объему частот или частностей. [4, стр. 11] Медиана для интервального ряда вычисляется для середины медианного интервала, за который принимается такой интервал, где сумма накопленных частот превышает половину значений частот ряда распределения. В данном случае для расчета медианы применяют формулу:
M е = X 0 + h *__Ѕ S f – Sm -1
fm , где:
X 0 – нижняя граница медианного интервала;
h – величина медианного интервала;
Ѕ S f – половина суммы накопленных частот ряда распределения;
Sm -1 – сумма накопленной частоты интервала, предшествующего медианному;
fm – частота медианного интервала.
Медиана не зависит от амплитуды колебания ряда, от распределения частот в пределах двух равных частей ряда, поэтому ее применение позволяет получить более точные расчеты, чем при использовании других форм средних.
По данным ряда распределения таблицаN4 определим структурные средние.
Таблица 4. Распределение районов Рязанской области по количеству общеобразовательных дневных учреждений на начало 2008/2009 учебного года
Группы районов по количеству ГОУ х | Число районов в группе f | X ¢ | Xf | Накопленные частоты fm |
До 15 | 5 | 10 | 50 | 5 |
От 15 до 25 | 9 | 20 | 180 | 14 |
От 25 до 35 | 8 | 30 | 240 | 22 |
От 35 до 45 | 5 | 40 | 200 | 27 |
Свыше 45 | 2 | 50 | 100 | 29 |
Всего: | 29 | 770 |
M0 = 15+10* = 15+10*0,8 = 23
Mе = 25 + 10*14,5–14 = 25+10*0,0625 = 25,6 »26
Полученные таким образом расчеты средней и структурных средних свидетельствуют о том, что наиболее часто в Рязанской области встречаются районы с числом дневных общеобразовательных учреждений равным 23. Однако более половины районов области имеют 26 общеобразовательных учреждений, при среднем количестве общеобразовательных заведений в районах 27.
При изучении явлений и процессов общественной жизни статистика встречается с разнообразной вариацией признаков, характеризующих отдельные единицы совокупности. Величины признаков изменяются под действием различных факторов. Очевидно, чем разнообразнее условия, влияющие на размер данного признака, тем больше его вариация.
При характеристике колеблемости признака применяют систему абсолютных и относительных показателей.
К абсолютным показателям вариации относят:
· размах вариации R = xmax – xmin;
· среднее линейное отклонение
· дисперсия s2 =
· среднеквадратическое отклонение s =.
Эти показатели (кроме дисперсии) измеряются в тех же единицах, что и сам признак: в тоннах, метрах, секундах, рублях. К относительным показателям вариации относятся:
· коэффициент осцилляции Косу =
· Линейный коэффициент вариации Kл..вар =
· Коэффициент вариации V =
Эти показатели выражаются в процентах или коэффициентах.
Наиболее простым способом измерения колеблемости является определение размаха вариации, то есть разности между максимальным и минимальным значениями признака. Величина R показывает, в каких пределах колеблется размер признака, образующего ряд распределения. Показатель R выражается в тех же единицах измерения, что и варианты признака. Но размах вариации, как показатель колеблемости имеет существенный недостаток. Его величина определяется крайними значениями признака, в то время как колеблемость последнего в целом складывается из суммы всех значений. Поэтому размах вариации может в ряде случаев неправильно характеризовать колеблемость признака.
В статистическом анализе вариации имеет большое значение дисперсия (s2 ). Однако ее применение как мера вариации в ряде случаев бывает не совсем удобным, потому что размерность дисперсии равна квадрату размерности изучаемого признака. В таких случаях для измерения вариации признака вычисляют среднеквадратическое отклонение.
Дисперсия и среднеквадратическое отклонение недостаточно полно характеризуют колеблемость признака, так как показывают абсолютный размер отклонений, что затрудняет сравнение изменчивости различных признаков.