Реферат: Нормы и интерпретация результатов теста
Глава XIV
ПРОСТЕЙШИЕ МЕТОДЫ
СТАТИСТИЧЕСКОЙ ОБРАБОТКИ МАТЕРИАЛОВ ПСИХОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ
Статистические методы применяются при обработке материалов психологических исследований для того, чтобы извлечь из тех количественных данных, которые получены в экспериментах, при опросе и наблюдениях, возможно больше полезной информации. В частности, в обработке данных, получаемых при испытаниях по психологической диагностике, это будет информация об индивидуально-психологических особенностях испытуемых. Вообще психологические исследования обычно строятся с опорой на количественные данные. Вот пример.
К школьному психологу обратился шестиклассник Саня Ю. с просьбой испытать его двигательный темп. Саню очень интересовал баскетбол, и он собирался вступить в баскетбольную команду, а баскетболист, несомненно, должен иметь высокий двигательный темп. Психолог разработал план небольшого исследования. Он начал с того, что попросил Саню так быстро, как он только может, ставить точки в центре кружков, нарисованных на листке бумаги. За одну минуту Саня поставил 137 точек. Насколько этот темп характерен для Сани? Чтобы установить это, психолог попросил Саню повторить эту пробу 25 раз. Действительно, некоторые результаты превышали первоначально полученное число, но некоторые оказались и поменьше. Психолог просуммировал все полученные за 25 проб результаты, а сумму разделил на 25 — таким путем он получил среднее арифметическое по всем пробам. Это среднее арифметическое составило 141. Таков по этой пробе максимальный темп Сани. Можно ли считать этот темп высоким? Потребовался еще один шаг в исследовании. Психолог сформировал группу из 50 шестиклассников, не отличающихся ни от Сани, ни друг от друга по возрасту более чем на полгода. С этими ребятами психолог также провел сначала по несколько тренировочных проб, чтобы получить надежные данные об их темпе, и, наконец, последнюю пробу, для обработки.
Все эти экспериментальные данные в виде средних арифметических были построены в один порядковый ряд, который был разбит по десяткам (по децилям). Санины данные вышли в десятку с наиболее быстрыми результатами. По этим количественным данным психолог сделал вывод о том, что Саня обладает сравнительно высоким двигательным темпом, о чем и было ему сообщено.
Современная математическая статистика представляет собой большую и сложную систему знаний. Нельзя рассчитывать на то, что каждый психолог, сделавший диагностику своей специальностью, овладеет этими знаниями. Между тем статистика нужна психологу постоянно в его повседневной работе. Специалисты-статистики разработали целый комплекс простых методов, которые совершенно доступны любому человеку, не забывшему то, что он выучил еще в средней школе.
В зависимости от требований, которые предъявляют к статистике различные области науки и практики, создаются пособия по геологической, медицинской, биологической, психологической статистике. (См., например: Суходольский Г.В. Основы математической статистики для психологов. Л., 1972). В этой главе даются простейшие методы статистики для психологов. Все необходимые для их применения вычисления можно выполнять на ручном компьютере, а то и на простых счетах. Уместное, грамотное применение этих методов позволит практику и исследователю, проведя начальную обработку, получить общую картину того, что дают количественные результаты его исследований, оперативно проконтролировать ход исследований. В дальнейшем, если возникнет такая необходимость, материалы исследований могут быть переданы для более глубокой разработки специалисту-статистику на большой компьютер.
Статистические шкалы. Применение тех или других статистических методов определяется тем, к какой статистической шкале относится полученный материал. С. Стивене предложил различать четыре статистические шкалы: шкалу наименований (или номинативную), шкалу порядка, шкалу интервалов и шкалу отношений.
Зная типические особенности каждой шкалы, нетрудно установить, к какой из шкал следует отнести подлежащий статистической обработке материал.
Шкала наименований. К этой шкале относятся материалы, в которых изучаемые объекты отличаются друг от друга по их качеству. При обработке таких материалов нет никакой нужды в том, чтобы располагать эти объекты в каком-то порядке, исходя из их характеристик. В принципе объекты можно располагать в любой последовательности. Вот пример: изучается состав международной научной конференции. Среди участников есть французы, англичане, датчане, немцы и русские (рис. 1). Имеет ли значение порядок, в котором будут расположены участники при изучении состава конференции? Можно расположить их по алфавиту, это удобно, но ясно, что никакого принципиального значения в этом расположении нет. При переводе этих материалов на другой язык (а значит, и на другой алфавит) этот порядок будет нарушен. Можно расположить национальные группы по числу участников. Но при сравнении этого материала с материалом другой конференции найдем, что вряд ли этот порядок окажется таким же. Отнесенные к шкале наименований объекты можно размещать в любой последовательности в зависимости от цели исследования.
При статистической обработке такого рода материалов нужно считаться с тем, каким числом единиц представлен каждый объект. Имеются весьма эффективные статистические методы, позволяющие по этим числовым данным прийти к научно значимым выводам (например, метод хи-квадрат).
Шкала порядка. Если в шкале наименований порядок следования изучаемых объектов практически не играет никакой роли, то в шкале порядка — это видно из ее названия — именно на эту последовательность переключается все внимание. К этой шкале в статистике относят такие исследовательские материалы, в которых рассмотрению подлежат объекты, принадлежащие к одному или нескольким классам, но отличающиеся при сравнении одного с другим: больше—меньше, выше—ниже и т.п.
Проще всего показать типические особенности шкалы порядка, если обратиться к публикуемым итогам любых спортивных соревнований. В этих итогах последовательно перечисляются участники, занявшие соответственно первое, второе, третье и прочие по порядку места. Но в информации об итогах соревнований нередко отсутствуют или отходят на второй план сведения о фактических достижениях спортсменов, а на первый план ставятся их порядковые места. Допустим, шахматист Д. занял в соревнованиях первое место. Каковы же его достижения? Оказывается, он набрал 12 очков. Шахматист Е. занял второе место. Его достижение — 10 очков.
Третье место занял Ж. с 8 очками, четвертое — З. с 6 очками и т.д. В сообщениях о соревновании разница в достижениях при размещении шахматистов отходит на второй план, а на первом остаются их порядковые места. В том, что именно порядковому месту отводится главное значение, есть свой смысл. В самом деле, в нашем примере 3. набрал 6, а Д. — 12 очков. Это абсолютные их достижения — выигранные ими партии. Если попытаться истолковать эту разницу в достижениях чисто арифметически, то пришлось бы признать, что 3. играет вдвое хуже, чем Д. Но с этим нельзя согласиться. Обстоятельства соревнований не всегда просты, как не всегда просто и то, как провел их тот или другой участник. Поэтому, воздерживаясь от арифметической абсолютизации, ограничиваются тем, что устанавливают: шахматист 3. отстает от занявшего первое место Д. на три порядковых места.
Заметим, что в других соревнованиях расклад абсолютных достижений может быть иным: занявший первое место может всего на пол-очка опережать ближайших участников. Важно, что он набрал наибольшее количество очков. Только от этого зависит его порядковое место.
Шкала интервалов. К ней относятся такие материалы, в которых дана количественная оценка изучаемого объекта в фиксированных единицах. Вернемся к опытам, которые провел психолог с Саней. В опытах учитывалось, сколько точек может поставить, работая с максимально доступной ему скоростью, сам Саня и каждый из его сверстников. Оценочными единицами в опытах служило число точек. Подсчитав их, исследователь получил то абсолютное число точек, которое оказалось возможным поставить за отведенное время каждому участнику опытов. Главная трудность при отнесении материалов к шкале интервалов состоит в том, что нужно располагать такой единицей, которая была бы при всех повторных измерениях тождественной самой себе, т.е. одинаковой и неизменной. В примере с шахматистами (шкала порядка) такой единицы вообще не существует.
В самом деле, учитывается число партий, выигранных каждым участником соревнований. Но ясно, что партии далеко не одинаковы. Возможно, что участник соревнований, занявший четвертое место — он выиграл шесть партий, — выиграл труднейшую партию у самого лидера! Но в окончательных итогах как бы принимается, что все выигранные партии одинаковы. В действительности же этого нет. Поэтому при работе с подобными материалами уместно их оценивать в соответствии с требованиями шкалы порядка, а не шкалы интервалов. Материалы, соответствующие шкале интервалов, должны иметь единицу измерения.
Шкала отношений. К этой шкале относятся материалы, в которых учитываются не только число фиксированных единиц, как в шкале интервалов, но и отношения полученных суммарных итогов между собой. Чтобы работать с такими отношениями, нужно иметь некую абсолютную точку, от которой и ведется отсчет. При изучении психологических объектов эта шкала практически неприменима.
О параметрических и непараметрических методах статистики. Приступая к статистической обработке своих исследований, психолог должен решить, какие методы ему более подходят по особенностям его материала — параметрические или непараметрические. Различие между ними легко понять. Вспомним, что говорилось об измерении двигательной скорости шестиклассников. Как обработать эти данные? Нужно записать все произведенные измерения — в данном случае это будет число точек, поставленных каждым испытуемым, — затем требуется вычислить для каждого испытуемого среднее арифметическое по результатам опытов. Далее следует расположить все эти данные в их последовательности, например, начиная с наименьших к наибольшим. Для облегчения обозримости этих данных их обычно объединяют в группы; в этом случае можно объединить по 5—9 измерений в группе. Вообще же при таком объединении желательно, если общее число случаев не более ста, чтобы общее число групп было порядка двенадцати. Получилась такая таблица (с. 249).
Далее нужно установить, сколько раз в опытах встретились числовые значения, соответствующие каждой группе. Сделав это, нужно для каждой группы записать ее численность. Полученные в такой таблице данные носят название распределения численностей. Рекомендуется представить это распределение в виде диаграммы — полигона распределения. Контуры этого полигона помогут решить вопрос о статистических методах обработки. Нередко они напоминают контуры колокола, с наивысшей точкой в центре полигона и с симметричными ветвями, отходящими в ту и другую сторону. Такой контур соответствует кривой нормального распределения. Это понятие было введено в математическую статистику К.Ф. Гауссом (1777—1855), поэтому кривую именуют также кривой Гаусса. Он же дал математическое описание этой кривой. Для построения кривой Гаусса (или кривой нормального распределения) теоретически требуется очень большое количество случаев. Практически же приходится довольствоваться тем фактическим материалом, который накоплен в исследовании. Если данные, которыми располагает исследователь, при их внимательном рассмотрении или после переноса их на диаграмму, лишь в незначительной степени расходятся с кривой нормального распределения, то это дает право исследователю применять в статистической обработке параметрические методы, исходные положения которых основываются на нормальной (О математически обоснованных способах определения того, можно ли считать данное распределение нормальным, см., например, в кн.: Урбах В.Ю. Математическая статистика для биологов и медиков. М., 1963. С. 66) кривой распределения Гаусса. Нормальное распределение называют параметрическим потому, что для построения и анализа кривой Гаусса достаточно иметь всего два параметра: среднее арифметическое, значение которого должно соответствовать высоте перпендикуляра, восстановленного в центре кривой, и так называемое среднее квад-ратическое, или стандартное, отклонение — величины, характеризующей размах колебаний данной кривой; о способах вычисления той и другой величины будет далее рассказано.
Параметрические методы обладают для исследователя многими преимуществами, но нельзя забывать о том, что применение их правомерно только тогда, когда обрабатываемые данные показывают распределение, лишь несущественно отличающееся от гауссова.
При невозможности применить параметрические методы, надлежит обратиться к непараметрическим. Эти методы успешно разрабатывались в последние 3—4 десятилетия, и их разработка была вызвана прежде всего потребностями ряда наук; в частности, психологии. Они показали свою высокую эффективность. Вместе с тем они не требуют сложной вычислительной работы.
Современному психологу-исследователю нужно исходить из того, что «существует большое количество данных либо вообще не поддающихся анализу с помощью кривой нормального распределения, либо не удовлетворяющих основным предпосылкам, необходимым для ее использования» (Рунион Р. Справочник по непараметрической статистике. М., 1982. С. 11.).
Генеральная совокупность и выборка. Психологу постоянно придется иметь дело с этими двумя понятиями. Генеральная совокупность, или просто совокупность, — это множество, все элементы которого обладают какими-то общими признаками. Так, все подростки-шестиклассники 12 лет (от 11,5 до 12,5) образуют совокупность. Дети того же возраста, но не обучающиеся в школе, или же обучающиеся, но не в шестых классах, не подлежат включению в эту совокупность.
В ходе конкретизации проблем своего исследования психологу неизбежно придется обозначить границы изучаемой им совокупности. Следует ли включать в изучаемую совокупность детей того же возраста, но обучающихся в колледжах, гимназиях, лицеях и других подобных учебных заведениях? В ответе на этот и на другие такие же вопросы может помочь статистика.
В подавляющем большинстве случаев исследователь не в состоянии охватить в изучении всю совокупность. Приходится, хотя это и связано с некоторой утратой информации, взять для изучения лишь часть совокупности, ее и называют выборкой. Задача исследователя заключается в том, чтобы подобрать такую выборку, которая репрезентировала бы, представляла совокупность; другими словами, признаки элементов совокупности должны быть представлены в выборке. Составить такую выборку, в точности повторяющую все разнообразные сочетания признаков, которые имеются в элементах совокупности, вряд ли возможно. Поэтому некоторые потери в информации оказываются неизбежными. Важно, чтобы в выборке были сохранены существенные, с точки зрения данного исследования, признаки совокупности. Возможны случаи, и для их обнаружения есть статистические методы, когда задачи исследования требуют создания двух выборок одной совокупности; при этом нужно установить, не взяты ли выборки из разных совокупностей. Эти и другие подобные казусы нужно иметь в виду психологу при обработке результатов выборочных исследований.
Следует рассмотреть типы задач, с которыми чаще всего имеет дело психолог. Соответственно приводятся и статистические методы, которые приложимы для обработки психологических материалов, направленных на решение этих задач.
Первый тип задач. Психологу нужно дать сжатую и достаточно информативную характеристику психологических особенностей какой-то выборки, например, школьников определенного класса. Чтобы подойти к решению этой задачи, необходимо располагать результатами диагностических испытаний; эти испытания, разумеется, следует заранее спланировать так, чтобы они давали информацию о тех особенностях группы, которые в этом конкретном случае интересуют психолога. Это могут быть особенности умственного развития, психофизиологические особенности, данные об изменении работоспособности и т.д.
Получив все экспериментальные результаты и материалы наблюдений, следует подумать о том, как их подать пользователю в компактном виде, чтобы при этом свести к минимуму потерю информации. В перечне статистических методов, используемых при решении подобных задач, обычно находят свое место и параметрические и непараметрические методы, о возможностях применения тех и других, как было сказано выше, судят по полученному материалу. Об этих статистических методах и их использовании пойдет речь ниже.
Второй тип задач. Это, пожалуй, наиболее часто встречающиеся задачи в исследовательской и практической деятельности психолога: сравниваются между собой несколько выборок, чтобы установить, являются ли выборки независимыми или принадлежат одной и той же совокупности. Так, проведя эксперименты в восьмых классах двух различных школ, психолог сравнивает эти выборки между собой.
--> ЧИТАТЬ ПОЛНОСТЬЮ <--