Реферат: Основные принципы тестирования

Наиболее распространенным способом нахождения теоретической валидности методики является конвергентная валидность, т.е. сопоставление данной методики с авторитетными родственными методиками т доказательства значимых связей с ними. Сопоставление с методиками, имеющими другое теоретическое основание и констатация отсутствия значимых связей с ними, называется дискриминантной валидностью.

Другой вид валидности – прагматическая валидность – проверка методики с точки зрения ее практической значимости, эффективности, полезности. Для проведения такой проверки, как правило, используются так называемые независимые внешние критерии, т.е. используется независимый от теста, внешний источник информации о проявлении в реальной жизни и деятельности людей измеряемого психического свойства. Среди таких внешних критериев могут быть успеваемость, профессиональные достижения, успехи в разных видах деятельности, субъективные оценки (или самооценки). Если, например, методика измеряет особенности развития профессионально-важных качеств, то для критерия необходимо, найти такую деятельность или отдельные операции, где именно эти качества реализуются.

Для проверки валидности теста можно использовать метод «известных групп», когда приглашаются люди, про которых известно, к какой группе по критерию они относятся (например, группа «высокоуспешных, дисциплинированных студентов» – высокий критерий и группа «неуспевающих, недисциплинированных студентов» – низкий критерий, а студенты со средними значениями не участвуют в тестировании), проводят тестирование и находят корреляцию между результатами теста и критерием.

Высокий критерий Низкий критерий
Высокий результат теста а в
Низкий результат теста с d

Здесь а – число испытуемых, попавших в высокую группу по тесту и по критерию, с – число испытуемых, попавших в высокую группу по критерию и имеющих низкие результаты теста. При полной валидности теста элементы в и с должны быть равны нулю. Меру совпадения, корреляции между крайними группами по тесту и критерию оценивают с помощью фи-коэффициента Гилфорда.

Если было 30 человек испытуемых, то статистически значимая связь теста с критерием можно констатировать если Р больше 0,36.

Что касается величины коэффициентов валидности, то она по разным причинам всегда ниже, чем коэффициент надежности. По мнению ведущих психодианостов, низким признается коэффициент валидности порядка 0,20 – 0,30, средним – 0,30 – 0,50, высоким – выше 0,60.

В зависимости от специфики самой диагностической методики и внешнего критерия различают несколько ее видов.

1. Валидность «по одновременности», или текущая валидность. Определяется с помощью внешнего критерия, информация по которому собирается в период проведения испытаний (например, успеваемость, производительность труда и др.).

2. Прогностическая, или «предсказывающая», валидность отличается тем, что информация по внешнему критерию собирается некоторое время спустя после проведения обследования. Такая валидность свидетельствует о вожможностях методики предсказывать успешность испытуемого в каких-либо видах деятельностию

Для проверки прогностической валидности теста нужно обследовать более 300 человек, например, абитуриентов, а через 2-3 года выделить среди этих людей критериальные группы «отличников» и «двоечников» и посчитать корреляцию с прежними показателями теста. Если корреляция выше 0,4-0,6, то тест можно использовать для профотбора абитуриентов и прогноза их учебной успешности.

3. Ретроспективная валидность определяется на основе критерия, отражающего события или состояния качества в прошлом. Она также может свидетельствовать о предсказательных возможностях методики.

Стандартизированность психодиагонсотической методики предполагает, с одной стороны, единую стандартную процедуру ее проведени и обработки результтатов, а с другой стороны, включает перевод «сырых первоначальных результатов теста» в стандартную шкалу тестовых баллов, в результате чего можно сопоставлять результаты у разных испытуемых в разных тестах. Выборка, на которой определяются статистические тестовые нормы, называется выборкой стандартизации» (она должна быть не менее 200 человек).

Обобщенная формула перевода сырого балла в заданную стандартную шкалу имеет вид:

Y = ДZ + M,

где Y – стандартный балл по произвольной стандартной шкале с центром М и отклонением Д.

Для многих тестов используют более сложную процедуру нелинейной нормализации (переход к нормальному распределению), в результате чего создают «конверсионную таблицу» для перевода сырых баллов в стандартные баллы по заданной шкале, в которой каждому «сырому баллу» указан соответствующий стандартный балл по определенной шкале, например, шкале «стенов», причем диагносту уже не дано делать самостоятельных вычислений по нормированию баллов.

Следует учитывать репрезентативность тестовых норм – правомерность применения тестовых норм в большой группе людей. Если тестовые нормы были вычислены на выборке школьников, то эти нормы нельзя автоматически переносить на студентов – надо провести рестандартизацию теста, проверить его на студентах и вычислить тестовые нормы для студентов.

Кроме статистических тестовых норм часто используют критериальные нормы, т.е. достиг ли человек критического требуемого уровня развития профессионально важного психологического качества. В критериальных тестах учитывают не степень отклонения баллов от центра шкалы, а достижение или недостижение какого-то критического уровня на шкале.

Следует учитывать и достоверность теста – способность теста защищать информацию от мотивационных (сознательных и бессознательных) искажений и социальной желательности ответов (это достигается через введение в тест проверочной шкалы лжи).

В случае, если тестирование проводится в интересах и по просьбе самого человека (ситуация консультирования), то ответы человека более правдивы. Если тестирование проводят по инициативе администрации, например в целях профотбора (ситуация экспертизы), то испытуемый склонен давать «социально-желательные», нужные, выгодные «ответы», т.е. эти ответы являются сознательно или бессознательно искаженными, и в этих случаях нельзя использовать тесты без шкалы достоверности.

Измерение психометрических характеристик теста осуществляют разработчики тест, но пользователи должны знать и понимать, на сколько тот или иной тест надежен, валиден, стандартизирован, достоверен и репрезентативен.

Таким образом, качество любой психодиагностической методики зависит от степени ее стандартизованности, надежности и валидности. При разработке любой диагностической методики ее авторы должны проводить соответствующую проверку и сообщать в руководстве к ее применению полученные результаты.

Главная цель статистического метода – представить количественные данные в систематизированной и сжатой форме с тем, чтобы облегчить их понимание. Колонка из 1000 тестовых показателей может производить внушительное, даже ошеломляющее впечатление. Но в таком виде она мало что говорит. Чтобы навести порядок в этом хаосе цифр, нужно прежде всего составить таблицу частного распределения.

Классы (интервалы) Частота

52 - 55

48 - 51

44 - 47

40 - 43

36 - 39

32 - 35

К-во Просмотров: 236
Бесплатно скачать Реферат: Основные принципы тестирования