Курсовая работа: Зависимость высоты дерева от среднегодовой температуры

Метод наименьших квадратов

Обычно в любой области науки при изучении двух величин проводятся эксперименты. Из-за того, что почти всегда измерение связано с погрешностями, соответствующие точки X и Y не ложатся на какую-то функцию и задача состоит в том, чтобы на основании экспериментальных точек выявить функциональную зависимость.

Если мы рассматриваем слабоформализованные системы, которые трудно поддаются однозначным и точным описаниям, связь между величинами X и Y изначально корреляционная. Это связано, в частности, с тем, что связи многопеременные, т.е. Y зависит не только от X, но и от других параметров, причем такая связь часто носит случайный характер.

В этом случае, имея экспериментальные точки, задача состоит в том, чтобы приближённо свести корреляционную связь к функциональной с помощью подбора такой функции, которая максимально возможным способом близка к экспериментальным точкам. Такая функция называется функцией регрессии.

Обычно вид самой функции угадывается, но она зависит от некоторых параметров. Задача статистического и корреляционного анализа состоит в нахождении этих параметров. Для этого и используется метод наименьших квадратов.

Линейная регрессия

Регрессия называется линейной, так как предполагается, что между X и Y существует линейная зависимость, то есть . Нужно провести эту прямую между экспериментальными точками оптимально. Введем некоторую величину – отклонение. Каждому x соответствуют два значения y. Пусть – экспериментальные точки, а – точки, соответсвующие значениям на прямой . Тогда пусть – расстояния между этимим точками. Отрезки – отклонения экспериментальных точек от теоретических. Отклонения разного знака, поэтому, чтобы полнее охарактеризовать суммарное отклонение, сложим их, возведя каждое в квадрат. Получим некоторую величину :

.

Очевидно, что линия регрессии будет оптимальной, если – суммарное отклонение в квадрате – минимальна. Для того, чтобы приняла минимальное значение, необходимо и достаточно, чтобы частные производные по и были равны нулю, т. е.

Решая систему, получим :

Решая систему, получим значения для a и b:

Пользуясь этими формулами мы сможем легко посчитать a, b и построить график линейной регрессии. В нашем случае a=2,9816, а b=3,4066. т. е. искомое уравнение линейной регрессии имеет вид y = 2,9816x + 3,4066. Для удобства наблюдения график регрессии будет на фоне диаграммы рассеивания.

Параболическая регрессия

Линейные связи являются основными, но нередко встречаются и нелинейные связи, хорошо описываемые параболой, гиперболой и т. д.

Уравнение регрессии в форме параболы второго порядка имеет вид: . Суммарное отклонение зависит от коэффициентов , и этой функции. Как и в предыдущем исследовании, нам необходимо провести оптимальную кривую, т. е. найти минимум функции .

Известно, что минимум достигается в точках, где частные производные равны нулю. В нашем случае имеем:

;

;

Решая систему, получаем a = 0,0002; b = 2,9769; c = 3,4225;

следовательно, искомое уравнение параболической регрессии имеет вид

математический систематизация квадратический отклонение

y = 0,0002x2 +2,9769x + 3,4225

К-во Просмотров: 187
Бесплатно скачать Курсовая работа: Зависимость высоты дерева от среднегодовой температуры