Книга: Всеобщее управление качеством TQM
Часто появляется необходимость определить зависимость между двумя показателями, в таком случае данные должны собираться парами (для анализа таких данных применяются диаграммы рассеивания ).
После сбора данных для их анализа можно переходить к применению статистических методов. Для этого данные должны быть упорядочены . Должен быть зарегистрирован источник данных. Сами данные должны быть зарегистрированы в удобной для дальнейшего использования форме (например, для данных, которые собираются часто, или постоянно разрабатываются контрольные листки ).
Сбор и обработка статистических данных основываются на применении выборочного метода.
Выборка – это часть данных, полученных из общей совокупности (генеральной совокупности), по отношению к которой на основании данных выборки делают определенные выводы.
Репрезентативной, или представительской выборка является в том случае, если она достаточно хорошо представляет характеристики генеральной совокупности.
Генеральная совокупность – однородная совокупность данных, по которой делаются выводы для принятия решения на основании результатов анализа выборки.
Данные, полученные на основании выборки – первичный статистический материал, на основании которого возможны обработка и анализ данных.
Например, решение о качестве партии продукции принимается на основании некоторой выборки, в пределах которой производятся измерения.
Таким образом, сбор данных – это не цель, а средство получения фактов, необходимых для принятия правильных решений.
Для упорядочения статистических данных можно произвести ранжирование, т.е. расположить полученные данные в порядке убывания или возрастания величин, а также подсчитать количество случаев регистрации одной и той же величины.
Величина А |
Случаи наблюдения величины А |
N S количество наблюдений величины А |
ХХХ,Х |
І І І І І |
5 |
YYY,Y |
І І |
2 |
ZZZ,Z |
I I I I I I I |
7 |
В полученном статистическом ряду величина N называется статистическим весом , или абсолютной частотой случайной величины, а данные в первом столбце – упорядоченным рядом случайной величины.
Изменения наблюдаемой величины могут быть дискретными и непрерывными.
Непрерывным называется такое изменение случайной величины, при котором находящиеся рядом значения в упорядоченном ряду этой величины отличаются на сколь угодно малую величину. Оно обычно может быть описано с помощью законов распределения Гаусса или Вейбулла.
Дискретным называется такое изменение случайной величины, при котором находящиеся рядом значения в упорядоченном ряду этой величины отличаются на некоторую конечную величину. Оно описывается биноминальным (гипергеометрическим) или пуассоновским законами.
Центральное значение интервала, его середина, называется величиной интервала, или его классом . Рекомендуется избегать слишком большого числа классов, т.к. при этом ряд может быть невыразительным. Проще оперировать рядами, в которых ширина классов одинакова.
Удобно представлять статистический материал числовыми значениями, отражающими в некоторой степени существенные характеристики статистического ряда – характеристики положения и рассеивания случайной величины. Важной характеристикой положения случайной величины является среднее арифметическое наблюдаемых значений. Оно является обобщающей характеристикой только в случае применения к однородной совокупности статистического материала.
Также существуют характеристики положения: