Реферат: Лекции по математической статистике
Меры центральной тенденции – первый момент, характеризующие данные
При исследовании массивов данных мы чаще всего оперируем величинами, характеризующими этот массив, именно по ним делаем вывод обо всей совокупности данных. К таким характеристикам относятся меры центральной тенденции, то есть значение наиболее часто встречающееся в данной совокупности. Этих мер существует несколько:
1) мода – это такое значение во множестве наблюдений которое встречается наиболее часто. Сложность в том, что редкая совокупность имеет единственную моду. (Например: 2, 6, 6, 8, 9, 9, 9, 10 – мода = 9).
Соглашения по поводу моры
· Если все значения в группе встречаются одинокого часто, считают, что у данной группы, моды нет.
· Когда два соседних значения имеют одинаковую частоту и эти частоты больше любых других частот в группе, то модой считают среднее от этих двух значений.
· Если два несмежных значения имеют равную и наибольшую в данной группе частоту, то у этой группы есть две моды, такая группа называется бимодальной. Бимодальной называется группа и в том случае, если эти две черты не совсем равны. В таких случаях договорились различать большую и малую моду и во всей группе, наряду с одной большой модой может быть несколько меньших мод.
2) медиана – это 50-тый процентиль в группе данных.
3) среднее (среднеарифметическое или выборочное среднее) – это сумма всех значений, разделенная на их количество. .
Мода наиболее просто вычисляется и при большом количестве измерений достаточно стабильна и близка к медиане и среднему. Медиана вычисляется по сложнее, особенно легко при ранжированных данных. В больших массивах предлагается сначала сгруппировать их, а потом вычислять медиану. Для определения моды и медианы не требуется знание всех остальных значений.
На определение среднего влияют значения всех изменений.
При наличии интервалов в значении, формула для среднего принимает вид:
Свойства среднего
1. Сумма всех n -отклонений от значения среднего должно быть равно нулю, то есть:
2. Если константу прибавить к каждому значению, то среднее увеличивается на ту же константу.
3. Если каждое значение умножить на константу, то среднее то же будет умножено на эту константу.
4. Сумма квадратов отклонений значений от их среднего меньше суммы квадратов отклонений от любой другой точки, то есть:
Средняя медиана и мода для объединенных групп
- среднее для каждого класса, - количество учащихся
Среднее общее группы:
Для определения моды и медианы объединенной группы необходимы конкретные значения измерений.
Мода – это такое число в группе, с которым совпадает наибольшее количество значений в группе.
Медиана – это такая точка на числовой оси, для которой сумма абсолютных значений разности всех значений меньше суммы разностей для любой другой точки. Если именно так определять понятие ошибки, то медиана дает минимальную ошибку. Если же ошибка определяется как сумма квадратов разностей, то минимальную ошибку дает среднее.
Выбор меры центральной тенденции
· В малых группах мода очень нестабильна;
· На медиану не влияет величины очень больших и очень малых значений;
· На величину среднего влияет каждое значение;
· Некоторые множества данных не имеют меры центральной тенденции. Такая ситуация близка к бимодальной гистограмме или U -образной;
· Центральная тенденция групп, содержащая крайние значения наилучшим образом представляется в том случае, если гистограмма унимодальна;