Реферат: Валидность психологического эксперимента
Оценка валидности реально проводимых экспериментов совершается путем использования неких «внутренних очков», сквозь призмы которых удается увидеть направления возможных или уже сделанных ошибок при планировании и проведении эксперимента. Р. Готтсданкер использовал удобный прием представления в качестве таких направлений мысленных образцов эксперимента.
Не следует путать понятия «мысленный эксперимент» (МЭ) и «мысленный образец» эксперимента. МЭ может быть понят, во-первых, как принятый норматив размышлений психолога на всех этапах следования логике экспериментальной проверки психологической гипотезы. Во-вторых, МЭ может рассматриваться в контексте использования психологом мысленных образцов с целью оценивания контроля угроз выводу об эмпирической зависимости. В-третьих, МЭ может представлять такой эксперимент, который нереализуем из-за отсутствия средств операционализации переменных, принятия определенных этических нормативов или экономических соображений и т.д.
В первых двух случаях путь мысленного экспериментирования – это обсуждение экспериментальной модели, задающей интересующую исследователя связь между переменными, когда анализируется реально проведенный или планируемый для реального сбора данных эксперимент. В третьем случае МЭ может представлять схему заведомо ирреального, т.е. в принципе нереализуемого исследования. В нем, однако, представлен путь возможной организации выводов, если бы исследователю были доступны предполагаемые формы экспериментального контроля.
Как и реально проводимый эксперимент, мысленный эксперимент является средством проверки не любых психологических гипотез. Детерминистски сформулированные гипотезы, проверяемые в МЭ, могут быть каузальными и структурно-функциональными. Последние не являются предметом экспериментирования в узком смысле этого термина, но могут направлять построение, например, формирующих экспериментов. Методы теоретического моделирования, более отвечающие проверке структурно-функциональных гипотез, не рассматриваются в данном учебнике, построенном как введение в эксперимент в качестве метода сбора эмпирических данных.
При планировании психологического эксперимента МЭ может быть понят и как осуществляемый во внутреннем, умственном плане ход экспериментальной деятельности, внешне реально развернутой в этапах проведения эксперимента. Собственно, все этапы планирования – это варианты мысленного экспериментирования с целью определения наилучших форм экспериментального контроля, выбора лучшего из возможных экспериментальных планов.
Наряду с планированием в функции мысленного эксперимента входит обоснование или оценка валидности реально проводимых экспериментов. Мысленные образцы, по отношению к которым оцениваются свойства реально проводимого эксперимента, позволяют обсуждать основные аспекты «правильности» построения экспериментальной модели. Правильность означает в данном случае лишь степень приближения к наилучшему мысленному воплощению экспериментальных условий, соответствующих конкретной экспериментальной гипотезе. Экспериментатор может правильно или неправильно выбрать и обосновать переменные, методики как средства операционализации этих переменных. Экспериментатор может ввести смешения НП с другими переменными или удачно избежать смешений. Он может получить более или менее надежные данные, установив то или иное количество проб на каждое из условий НП; может обеспечить случайность разброса условий побочных переменных по уровням НП или не проконтролировать несистематическую изменчивость (НП, ЗП, побочных факторов).
Именно такое прочтение функций мысленных образцов представлено в использованных Р. Готтсданкером понятиях идеального и бесконечного экспериментов, экспериментов полного соответствия и безупречного. Все эти четыре термина служат для уточнения критериев, в соответствии с которыми необходимо оценивать успешность планирования, организации и проведения эксперимента, осуществляемого реально.
В контексте рассматриваемых нормативов профессиональных рассуждений психолога термин «мысленный эксперимент» – один из таких нормативов (или «внутренних очков»), используя которые психолог может ответить на многие вопросы относительно достигнутого уровня эмпирической подкрепленности проверяемой каузальной гипотезы. Однако нет рецепта, как пользоваться этими «очками» в каждом конкретном случае. Иногда от них нужно отказаться, если тип исследования не таков, чтобы применять к нему сложившиеся нормативы экспериментальной оценки гипотезы. Однако такой отказ не следует путать с неумением правильно организовать и проводить психологический эксперимент.
1.2 Виды валидности при оценке психологического эксперимента
Виды валидности – это направления сравнений реально проводимых экспериментов с мысленными образцами. Оценка валидности связана как с оценкой реализации выбранных форм экспериментального контроля, так и с оценкой системы умозаключений при организации исследования с точки зрения следования нормативам экспериментального вывода. Нормативы, связанные с возможными обобщениями из психологических экспериментов, предполагают разведение разных видов валидности.
Внутренняя и внешняя валидность – обязательно обсуждаемые аспекты правильного эксперимента, будь то эксперимент в научных или практических целях. Отличия в выводах из этих экспериментов будут касаться того, как строится обобщение: переносится ли оно на других людей, другие ситуации, виды деятельности или на теоретическую модель.
Внутренняя валидность эксперимента обеспечивает вывод только об исследуемой зависимости, т.е. об отношении между независимой и зависимой переменными, но ничего не сообщает о возможности ее распространения за пределы данной экспериментальной ситуации. Если полученные данные характеризуются ненадежностью или наличием смешений (систематических, несистематических, сопутствующих), то нельзя считать обоснованным утверждение, формулируемое в экспериментальной гипотезе, даже если получен соответствующий ей экспериментальный эффект.
Если внутренняя валидность проведенного эксперимента оценивается высоко, то из этого также еще не следует, что установленная экспериментально зависимость соответствует чему-либо в реальности. Так, в лабораторных экспериментах экспериментальная модель может представлять модель научную, репрезентирующую определенные связи между операционализированными переменными. Возможны случаи, когда для этих моделей потом не находятся те виды субъективной реальности, которые они были призваны репрезентировать в экспериментальной ситуации. Тем самым не находится той эмпирии, на которую можно было бы перенести обобщение установленной в эксперименте зависимости.
Внешняя солидность, предполагающая решение проблем соответствия (НП, ЗП, ДП), обеспечивает возможность обобщения на те виды ситуаций или виды деятельности, которым соответствуют экспериментально контролируемые переменные. Если речь идет о теоретических обобщениях, то оценка внешней валидности уступает место оценке конструктной валидности. Решение вопросов о конструктной и внешней валидности приводит исследователя к выбору типа эксперимента: естественного («дублирующего реальный мир»), искусственного (улучшающего реальный мир) или лабораторного.
Необходимо различать системы теоретических положений, предполагающих, что они имеют отношение к миру реальности (для психологических теорий это мир субъективной, или психологической, реальности), и положений, не нацеленных на соотнесение мира теории и эмпирии (как онтологической реальности, если пользоваться терминологией П. Фресса и Ж. Пиаже). Это различение может касаться авторской позиции: «если моей теории в мире реальности ничего не соответствует, то пусть ей – реальности – будет хуже». Оно может быть следствием того, что сформулированным психологическим конструктам не было найдено соответствия на уровне опытных данных. При рассмотрении особенностей экспериментального метода речь идет несколько о другом – о возможности эмпирически оценивать теоретические каузальные объяснения.
Экспериментальный метод предполагает построение исследования с целью отвержения неадекватных объяснений или «неверных» теорий как не соответствующих эмпирически установленным зависимостям. Чаще неразличение продуктивного теоретизирования и псевдотеоретизирования связано с тем, что всегда необходим существенный «прорыв» в обобщении, чтобы соотнести хотя бы посредством гипотетических конструктов закономерности, устанавливаемые при построении экспериментальных ситуаций (экспериментальных моделей) и теоретических моделей. Только содержательное обсуждение устанавливаемой в каузальной гипотезе связи между переменными, учитывающее объяснительные принципы, сложившиеся в рамках конкретных психологических школ, позволяет исследователю настаивать на реальности, т.е. «эмпирической загруженности», стоящих за переменными психологических понятий и исследуемых зависимостей. Анализ эмпирической загруженности следующих из теории гипотез выполняет при этом существенную роль «ограничителя» для утверждения псевдозакономерностей.
Понятие конструктной валидности охватывает соответствующий аспект оценки правильности построения эксперимента: насколько обоснованным был переход от представленных в теоретической гипотезе понятий – психологических конструктов к эмпирическим их репрезентациям как НП, ЗП, ДП, а также насколько объяснение установленной зависимости действительно следует из представляемой автором теории. Еще до выбора конкретных методик или уже при их обосновании экспериментатор осуществляет тот «прорыв» в обобщении (от теории к эмпирии), который связан с множественностью экспериментальных воплощений универсальных высказываний. Один и тот же конструкт (например, понятие агрессии или фрустрации) может предполагать разные модели возникновения и регуляции исследуемых феноменов, т.е. всегда возникает вопрос, какая авторская позиция стоит за используемым психологическим понятием. Эта позиция во многом определит, как будут конкретизированы переменные на уровне экспериментальной и контргипотез.
Уже рассмотренная проблема возможной множественной интерпретации одной и той же экспериментальной зависимости фиксирует другой аспект конструктной валидности, а именно: насколько обоснованным выглядит авторское введение гипотетических конструктов в каузальную зависимость как объяснение связи между НП и ЗП. Известно, что отсутствие сильных конкурирующих объяснений – это третье условие причинного вывода. В реальности конкурирующие объяснения остаются всегда, вопрос только в том, насколько более обоснованной выступает авторская интерпретация по сравнению с другими объяснениями той же установленной зависимости. Понятно, что эта оценка – содержательная, а не только формально-логическая (что тоже должно учитываться – как проявление логической компетентности автора). Само принятие той или иной позиции может характеризовать пристрастия экспериментатора, однако оценка конструктной валидности уже не может быть столь же пристрастной, поскольку она связана с отражением в гипотезе накопленных знаний об исследуемой реальности.
Проблема не в различении старых и новых гипотез, которые в разной степени подкреплены эмпирическими доводами. В. Налимов назвал эту проблему одним из парадоксов в понимании развития науки, по К. Попперу. Парадоксальным выглядит тот факт, что новая гипотеза, в пользу которой имеется меньше теоретических и эмпирических доводов, со временем вытесняет старую, обычно более хорошо подкрепленную проведенными исследованиями. Проблема в том, как автору добиться согласия предполагаемого профессионального читателя отчета об исследовании с тем, что автор эксперимента достоверно представил на уровне эмпирических реалий теоретически подразумеваемые конструкты, а не осуществил их вольную или невольную подмену другими.
Итак, оценка обоснованности перехода от уровня теоретических положений к уровню экспериментальной и контргипотезы – вопросы конструктной валидности эксперимента. Решение проблем операционализации переменных в методических процедурах их измерения (и управления) – вопросы операциональной валидности. Если обобщение зависимости включает перенос ее на «жизненные», т.е. реальные, виды ситуаций и деятельности человека – это решение проблем соответствия переменных с точки зрения внешней, или, как ее теперь иногда называют, экологической валидности.
Оценка операциональной валидности охватывает этап перехода от уже сформулированных экспериментальных и контргипотез к процедурам их методического воплощения. Одна и та же переменная может быть представлена показателями разных методик. Одна и та же мысленная модель эксперимента может быть реализована при достаточно разном «техническом» или операциональном воплощении управляемых и измеряемых переменных.
Популяционные гипотезы, имеющие целью перенос обобщений на конкретные группы людей и целые популяции, могут оцениваться с помощью использования мысленных образцов, но не могут быть проверены в умственном плане. Те дополнительные переменные, которые должны быть учтены исследователем в целях обобщения, не обеспечивают обоснования условий необходимости или достаточности в контексте представленности в реальном поведении людей или в реальных ситуациях действия именно тех механизмов, которые рассматривались в МЭ.
Факторы, угрожающие внутренней валидности эксперимента, рассматриваются в связи с обсуждением формального планирования как условия принятия решений об экспериментальном факте. Разработка межгрупповых или интраиндивидуальных планов направлена в первую очередь на обеспечение контроля внутренней валидности. Применительно к стратегиям отбора испытуемых в группы из популяций следует также обсуждать взаимосвязь внешней (популяционной) и внутренней валидности, поскольку этими стратегиями решаются одновременно две задачи: обеспечение репрезентативности выборки испытуемых, и эквивалентности сравниваемых групп.
1.3 Конструктная валидность и концептуальные репликации
Психологическая гипотеза, эксплицируемая, или выводимая, как следствие из той или иной теоретической концепции, при повторных проверках может несколько видоизменяться, если изменяются средства операционализации входящих в нее переменных. В случае когда предполагается выявление одной и той же теоретически предполагаемой зависимости, но психологические конструкты конкретизируются разными методическими средствами, это называется концептуальными репликациями. Так, при множественных измерениях зависимой переменной разными методиками повышается обоснованность утверждений о характере изучаемого базисного процесса. Изменения типов задания независимых переменных также расширяют диапазон обобщений устанавливаемой психологической закономерности. Существенно, что при этом имеется в виду однозначность интерпретации самого психологического конструкта («мотивация достижения», «функциональные состояния», «гибкость–ригидность контроля» и т.д.).
На самом деле в психологии часто при использовании одного и того же понятия изучаются разноуровневые базисные процессы, т.е. в экспериментах с терминологически сходными формулировками гипотез представлены достаточно отличающиеся друг от друга типы переменных. Рассмотрим в качестве примера конструкт «импульсивность». Существует множество теоретических расхождений в обосновании методик, претендующих на измерение переменной импульсивности как индивидуального или личностного свойства. Одни из них связывают импульсивность со снижением рациональности, функции планирования, недостаточностью самоконтроля, т.е. одной из генерализованных черт поведения человека. Другие измеряют импульсивность как когнитивный стиль. Третьи настаивают на связи импульсивности со свойствами темперамента. Допустим, что авторы находятся в рамках сходных методологических подходов к пониманию личности, например, с позиции теории черт, но и в этом случае труднодостижимым оказывается согласие в том, какова психологическая реальность, соответствующая этому свойству.
Экскурс 1
Согласно Г. Айзенку необходимо различать черты личности, понимаемые как поведенческие проявления ее в строго ограниченных областях, и типы, или измерения личности, связываемые с проявлением значимых для нее форм поведения в более общем плане. Черта импульсивности отличается тем, что занимает как бы промежуточное место между этими двумя уровнями в иерархии личностных качеств. Она включает 4 фактора: склонность к риску, снижение или отсутствие планирования, живость реагирования и «узкую импульсивность». Существенно, что структура этого «гибрида» заставляет Г. Айзенка согласиться с одним из утверждений, вытекающим из результатов исследований Р. Кеттэлла: с правомочностью взаимокорреляций между разнопорядковыми шкалами, выделяемыми в теориях черт.
В последующем в совместных работах Ганса и Сибиллы Айзенк понятие «импульсивность» претерпевало следующие изменения. Сначала «импульсивность» вместе с «общительностью» и «оживленностью» включалась как составная часть в фактор «экстраверсии». Потом в связи с выделением «психотизма» как фактора второго порядка стали различать «рискованность», относящуюся к экстраверсии, и «импульсивность» в узком смысле, более тесно связанную с «психотизмом» (импульсивность в широком смысле). Попытка выделить «склонность к риску» и «узкую импульсивность» в качестве отдельных шкал оказалась в разной степени удачной для женской и мужской выборок.
Итак, простор для конкретизации психологического конструкта «импульсивность» остается достаточным даже в пределах одной исходной концепции. Обобщение при проверке гипотез, влючающих переменную импульсивности, должно учитывать устанавливаемые для этого свойства внешние и внутренние детерминанты.
1.4 Специфика оценки валидности лабораторного эксперимента
Специальным случаем является обобщение, связанное с организацией в эксперименте «очищенных» условий для проверки так называемых точных гипотез. Обычно это функция лабораторного эксперимента: получить данные в условиях, отвечающих причинно-следственным зависимостям в специально сформулированной модели, чтобы эмпирически оценить объяснительную силу этой теоретической модели. Однако обобщения теоретического характера связаны не только с таким ходом рассуждения, как «эксперимент – модель – теория». Оценка силы тех или иных обобщений выявляется и в анализе свойств самой теории – применительно к «миру теорий» (а не к миру «психологической реальности»). Независимо от того, моделируется ли в эксперименте ситуация, отражающая теоретическую модель или модель «внешнего мира», оценивается как объяснительная сила высказывания, сформулированного в виде экспериментальной гипотезы, так и возможность перехода от той или иной теории как системы объяснений к этому эмпирически нагруженному высказыванию. ЭГ как эмпирическая гипотеза будет включать переменные, которые можно не только наблюдать, но и измерять (в той или иной шкале).
--> ЧИТАТЬ ПОЛНОСТЬЮ <--