Реферат: Возможности анализа данных медико-биологических экспериментов в программе Statistica
2. Предварительный анализ данных, направленный на выяснение общей формы данных и предложение путей более обстоятельного анализа. Часто такой предварительный анализ успешно проводится простыми графическими методами или путем табличного представления данных.
3. Итоговый анализ (статистическая обработка), цель которого – дать основу для выводов.
4. Представление выводов в краткой и ясной форме. Обычно это приводит к необходимости интерпретации выводов на языке рассматриваемой области исследования [6].
Любой статистический анализ начинается с определения основных параметров описательной статистики, таких как мода, медиана, значения перцентилей и т. д. вычисление параметров описательной статистики осуществляется в модуле Basic Statistics/Tables (Основные статистики и таблицы).
В модуле Basic Statistics/Tables в разделе Summary.Descriptive на вкладке Advaced позволяет вычислить следующие параметры описательной статистики:
· Valid N — общее число вариантов в выборке;
· Mean — среднее арифметическое;
· Sum - сумма всех значений вари; Median — медиана;
· Standard Deviation - среднее квадратическое отклонение выборки;
· Variance — дисперсия выборки;
· Standard error of mean — ошибка среднего арифметического;
· 95% confidence limits of mean — 95% доверительный интервал для среднего;
· Minimum & maximum — минимум и максимум;
· Lower & upper quartiles — границы 1 и 3 квартилей;
· Range — размах выборки (определяется как разность между максимальным и минимальным значениями вариантов);
· Quartile range — диапазон квартилей;
· Skewness — коэффициент асимметрии
· Kurtosis — коэффициент эксцесса
· Standard error of skewness — стандартная ошибка асимметрии
· Standard error of kurtosis — стандартная ошибка эксцесса [7].
Выбор метода анализа в соответствии с типом распределения данных
Существует множество методов статистического анализа данных. В каждом конкретном случае можно выбрать несколько возможных вариантов анализа. Однако при несоблюдении критериев использования того или иного метода полученный результат может оказаться неточным.
Наиболее характерными являются ошибки:
· использование параметрических методов (основанных на предположении о нормальном распределении данных) для анализа данных, не подчиняющихся нормальному распределению (1);
· использование методов, предназначенных для независимых выборок, при анализе парных данных (2) [10, 11].
STATISTICA позволяет проверить описываются ли распределение признаков нормальным законом распределения (з. Гаусса). В тех случаях, если данные распределяются по какому-либо иному закону, нельзя проводить сравнение по достаточно популярным критериям Стьюдента или подсчет корреляции по методу Пирсона. Если данные являются дискретными, их сопоставление проводится по критериям c2 , а непрерывные данные сопоставляются по критерию Колмогорова — Смирнова. Рассчитать критерии Колмогорова — Смирнова для нормального расправления можно в модуле Basic Statistics/Tables (Descriptive Statistics--Normality --Kolmogorov-Smirnov & Lilliefors test for normality) с помощью Frequency tables либо Histograms.
В пакете STATISTICA можно сопоставить данные не только с нормальным, но и с некоторыми другими законами распределения c помощью Distributiom fitting (в меню Statistics). Если данные являются дискретными величинами, выбор распределения проводится в разделе Discrete Distributions, если же они являются непрерывными величинами — то в разделе Continuous Distributions. Несмотря на то что критерии Колмогорова—Смирнова и c 2 достаточно четко позволяют ответить на вопрос, каким законом описываются полученные данные, их недостатком является то, что при малых значениях выборки достоверность оценки снижается.
При нормальном распределении данных коэффициент асимметрии должен быть равен нулю, а коэффициент эксцесса должен быть равен трем, что является ещё одним методом проверки типа распределения.
Для выявления взаимосвязи нескольких переменных, измеряемых по порядковой или интервальной шкале коэффициент корреляции Пирсона . Этот коэффициент, как и всякий параметрический показатель, весьма подвержен влиянию значений, резко отклоняющихся от среднего [9].