Учебное пособие: Выборочный метод
Если же генеральное среднее квадратическое отклонение σ неизвестно и приходится пользоваться его выборочной оценкой s , то используется статистика t (1.9.26), которая, как мы уже отмечали, подчинена закону распределения Стьюдента с v = n —1 степенями свободы. При v < 30 имеются значительные различия между распределением Стьюдента и нормальным распределением (тем более значительные, чем меньше v ). Используя функцию распределения Стьюдента, мы можем записать равенство, аналогичное формуле Лапласа:
(1.9.27)
где S ( t , v ) — функция Стьюдента, значения которой для различных значений t и v подробно рассчитаны и представлены в специальных таблицах.
Выражение ( 1.9.27) эквивалентно выражению:
(1.9.28)
где
Решение задач с помощью этого равенства аналогично решению задач с использованием формулы Лапласа. Лишь определение п несколько усложняется из-за того, что оно входит также в параметр v = n —1.
Поэтому можно воспользоваться схемой последовательных приближений. Вначале производят оценку (s 2 ) генеральной дисперсии. Затем находят п1 по схеме (1.9.25), используя таблицу функции Лапласа и принимая σ2 = s 2 - По найденному n 1 и, соответственно, v 1 = n 1 — 1 и заданному значению
Р =1—α определяют t 1 (по таблице распределения Стьюдента) и вычисляют и так далее.
Теперь можно снова повторить расчет по v 2 = n 2 — 1 и т.д.
Итерация заканчивается, если окажется ni ≈ ni -1 .
Пример 1.9.7. Для определения среднего заработка работника за день при соблюдении необходимых условий было отобрано 10 работников, заработок которых оказался равным (в руб.): 325; 337; 319; 330; 327; 328; 332; 320; 318; 334. Требуется определить с вероятностью 0,95 доверительный интервал для среднего заработка работников в генеральной совокупности, если есть основания полагать, что заработная плата в генеральной совокупности подчиняется нормальному закону определения.
Решение:
По данным выборки определяем среднюю и дисперсию. Получаем
;
Рассчитываем несмещенную оценку генеральной дисперсии
Предположение о нормальном характере генерального распределения позволяет нам использовать равенства (1.9.27) и (1.9.28). Обращаясь к таблице значений функции Стьюдента, по заданным P = 2 S ( t , v )=0,95 и v = n —1 = 10 – 1 = 9 находим t = 2,26.
Вычисляем предельную ошибку выборки ε=(кг).
Доверительный интервал для генеральной средней:
327—5<<327+5 или 322<<332.
Пример 1.9.8. Используя данные примера 1.9.7, определить объем выборки, необходимый для того, чтобы ошибка выборочной средней с вероятностью 0,95 не превышала 3 рубля.
Решение.
Мы имеем оценку генеральной дисперсии s2 = 42,4. Вначале находим n 1 по формуле (1.9.25), принимая σ2 = s 2 и определяя z по таблице функции Лапласа:
Теперь обращаемся к таблице функции Стьюдента и по Р = 0,95,
v 1 = n 1 —1 ≈ 17 находим значение t 1 =2,11.
Вычисляем
По Р = 0,95 и v 2 = n 2 —1 = 21 – 1 = 20 находим t 2 = 2,09.