Курсовая работа: Проведение статистического анализа и прогнозирование результатов выпуска изданий Беларуси и России
Случайная величина называется непрерывной , если ее возможные значения сплошь заполняют некоторый интервал. Основными формами задания непрерывной случайной величины являются:
· интегральная функция распределения F(x);
· функция плотности вероятности f(x).
Интегральная функция распределения для непрерывной случайной величины Х определяется так же, как и для дискретной F (x ) = P (X < x ).
Плотность вероятности (дифференциальной функцией распределения ) случайной величины Х называется функция
f ( x ) = F ´ (x ). (2.2)
Для непрерывной случайной величины Х функция распределения F (x ) непрерывна на всей оси Ох , а плотность вероятности f (x ) существует везде, за исключением, может быть, конечного числа точек.
Математическим ожиданием mx непрерывной случайной величины Х , для которого функция f (x ) является плотностью вероятности, называется величина несобственного интеграла
, (2.3)
еслион сходится.
Дисперсией называется значение несобственного интеграла
, (2.4)
если он сходится.
При вычислении дисперсии иногда удобна формула
. (2.5)
Кроме математического ожидания для характеристики положения центра распределения случайной величины часто используют моду и медиану. Модой называется то значение случайной величины, которому соответствует наибольшая плотность вероятности ее распределения.
Медианой называется значение случайной величины, для которой интегральная функция распределения F (x ) = 0,5.
Для того чтобы рассчитать значения моды и медианы, необходимо вначале определить модальный и медиальный интервал. Модальный интервал на гистограмме отвечает наибольшей частоте попадания случайной величины. Моду рассчитывают по формуле
, (2.6)
где ХМо – нижняя граница модального интеграла; С – величина интервала (разность между верхней и нижней границами); Δ1 – разность числа попаданий случайной величины в модальный интервал и предыдущий интервал; Δ2 – разность попаданий случайной величины в модальный интервал и последующий интервал.
Медиальный интервал определяется по формуле
, (2.7)
где ХМе – нижняя граница медиального интервала С ; h Ме – количество попаданий случайной величины в медиальный интервал; N – общее количество опытов; Sn – сумма исходов, соответствующих попаданию случайной величины в интервалы, не превышающие количество N /2.
Корреляция
Существуют две категории связей или зависимостей между признаками: функциональные и корреляционные. При функциональной зависимости каждому значению одной переменной соответствует одно значение другой переменной.
Связь случайной величины всегда носит вероятностный характер. Следовательно одному значению одной случайной величины соответствует несколько значений другой случайной величины. Такая зависимость называется корреляционной.
Самым простым случаем вероятностной связи является корреляция двух факторов — парная корреляция. Наглядное представление о парной корреляции дает корреляционное поле — графическое изображение точек, координаты которых соответствуют значениям случайных величин.
Различают положительную и отрицательную корреляции. При положительной корреляции зависимость между случайными величинами прямая, т. е. при увеличении значений одной случайной величины увеличиваются и значения второй случайной величины. При отрицательной корреляции увеличению значений одной случайной величины соответствует уменьшение значений второй случайной величины.
Связь двух факторов тем больше, чем теснее располагаются точки около некоторой линии, отображающей график зависимости одной случайной величины от другой. Если все точки корреляционного поля попадают на эту линию, то теснота связи окажется максимальной, и получается функциональная зависимость двух случайных величин. Для количественного определения тесноты связи между двумя случайными величинами в случае линейной корреляции используют коэффициент корреляции, который может быть определен по двум следующим формулам:
, (2.8)
где xi , yi — текущие значения случайных величин;
— средние значения случайных величин.