Контрольная работа: Валидность теста
Студент
Т.А. Карпова
Владивосток 2007
Содержание
Введение
1. Понятие теста
2. Показатели качества тестов (методик)
3. Виды валидности и её нахождение
4. Проблемы валидности
Заключение
Список использованных источников
Введение
Термин «тест», получивший чрезвычайно широкое распространение в различных областях знания в смысле испытания, проверки, имеет давнюю историю. По Р. Пэнто и М. Гравитц (1972), слово «тест» происходит из старофранцузского языка и является синонимом слова «чашка» (лат. testa – ваза из глины). Этим словом обозначали небольшие сосуды из обожжённой глины, использовавшие алхимиками для проведения опытов. В русском языке слово «тест» долгое время имело два значения:
1) испытательная присяга, религиозная английская клятва, которую каждый вступающий в общественную должность должен давать, чтобы доказать, что он не тайный католик;
2) плоский плавильный сосуд или сосуд из выщелоченной золы для выделения олова из золота или серебра (Русский энциклопедический словарь. 1877).
Близкое современному содержание термин «тест» как термин психологический получает в конце XIX в.
Тестами в психологии называют стандартизированные методики психодиагностики, позволяющие получать сопоставимые количественные и качественные показатели степени развитости изучаемых свойств.
Под стандартизированностью таких методик имеется ввиду то, что они всегда и везде должны применяться одинаковым образом, начиная от ситуации и инструкции, получаемой испытуемым, кончая способами вычисления и интерпретации получаемых показателей. Сопоставимость означает, что оценки, получаемые при помощи теста, можно сравнивать друг с другом независимо от того, где, когда и кем они были получены, если, разумеется, тест применялся правильно. Из всех возможных психодиагностических методик к тестам предъявляются самые строгие требования, касающиеся валидности, надежности, точности и однозначности.
Существует много разновидностей тестов, которые разделяются на группы по нескольким основаниям: по предмету тестирования (тому качеству, которое оценивается с помощью данного теста); по особенностям используемых в тесте задач; по материалу, предъявляемому испытуемым; по объекту оценивания.
1. Понятие теста
В психодиагностике известны разнообразные классификации тестов. Они могут подразделяться по особенностям используемых тестовых заданий на тесты вербальные и тесты практические, по форме процедуры обследования – на тесты групповые и индивидуальные, по направленности – на тесты способностей, тесты личности и тесты отдельных психических функций, а в зависимости от наличия или отсутствия временных ограничений – на тесты скорости и тесты результативности. Также тесты могут различаться по принципам их конструирования. За последние десятилетия многие известные тесты были приспособлены к среде компьютера (предъявление, обработка данных и др.), их можно обозначить как компьютеризированные тесты. Активно разрабатываются тесты компьютерные, изначально конструируемые с учётом возможностей современной вычислительной техники. Тесту, как и любому другому инструменту познания, присущи особенности, которые в конкретных обстоятельствах исследования могут рассматриваться в качестве его достоинств и недостатков. Эффективное использование тестов зависит от учета многих факторов, из которых к важнейшим относятся: теоретическая концепция, на которой базируется тот или иной тест; область применения; весь комплекс ведений, обусловленных стандартными требованиями к психологическим тестам, их психометрическим характеристикам. Распространённые представления о «простоте» и доступности тестов не соответствуют действительности. Являясь средством исследования сложнейших психических явлений, тест не может толковаться упрощённо как предложение задания и регистрация его решения. Научное использование тестов возможно лишь при условии опоры на общепсихологические знания, компетентность в области теории и практики соответствующих психодиагностических исследований. Не менее существенно следование этическим нормам психодиагностики.
2. Показатели качества тестов (методик)
Особое значение имеет выбор критерия оценки получаемых результатов. Сами по себе, без сопоставления с точкой отсчёта, результаты психологических испытаний ничего не значат. Чаще всего они сопоставляются с нормами выполнения в выборке стандартизации (репрезентативная выборка того типа, для которого данная методика предназначена, например, дети определённого возраста, студенты высших учебных заведений сходного профиля, представители той или иной профессии и др.). Эти нормы, таким образом, устанавливаются опытным путём. Затем результаты каждого испытуемого сопоставляются с нормой и квалифицируются как средние, высокие и низкие. Это позволяет определить положение конкретного испытуемого относительно нормативной выборки или выборки стандартизации. Для этого «сырые» баллы (т.е. количество правильных ответов) с помощью специальных таблиц переводятся в стандартные показатели, сопоставимые друг с другом и с нормой. В данном случае используется статистическая норма – средний диапазон значений на шкале измеряемого свойства – это тот уровень, который характеризует статистически среднего человека. Однако в последние годы такой способ оценки результатов тестирования подвергается критике.
Полезнее ориентироваться на систему требований, которую общество на определённом этапе своего развития предъявляет каждому из его членов. Это могут быть требования к умственному, эстетическому, нравственному развитию человека. Чтобы жить в обществе, человек должен отвечать данным требованиям. Содержание таких социально-критериальных норм (социально-культурных нормативов) вполне реально, оно присутствует в образовательных программах, в квалифицированных профессиональных характеристиках, общественном мнении, мнении педагогов, воспитателей. В качестве точек отсчёта могут быть использованы и другие критерии, например, возрастные нормы, критерии выполнения деятельности и др.
Важнейшими показателями качества психодиагностических методик являются надёжность и валидность. Наша задача – рассмотреть, что же такое валидность теста.
3 Виды валидности и её нахождение
По определению американского текстолога А.Анастази, «валидность теста – понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает». Валидность свидетельствует о том, пригодна ли методика для измерения определённых качеств, особенностей и насколько эффективно она это делает. Наиболее распространённым способом нахождения теоретической валидности теста (методики) является конвергентная валидность, то есть сопоставление данной методики с авторитетными родственными методиками и доказательство значимых связей с ними.
Сопоставление с методиками, имеющими другое теоретическое основание, и констанция отсутствия значимых связей с ними называется дискриминантной валидностью. Другой вид валидности – прагматическая валидность – проверка методики с точки зрения её практической значимости, эффективности, полезности. Для проведения такой проверки, как правило, используются так называемые независимые внешние критерии, то есть используется независимый от теста, внешний источник информации о проявлении в реальной жизни и деятельности людей измеряемого психического свойства. Среди таких внешних критериев могут быть успеваемость, профессиональные достижения, успехи в разных видах деятельности, субъективные оценки (или самооценки). Если например, методика измеряет особенности развития профессионально важных качеств, то для критерия необходимо найти такую деятельность или отдельные операции, где именно эти качества реализуются.
Для проверки валидности теса можно использовать метод известных групп, когда приглашаются люди, про которых известно, к какой группе по критерию они относятся (например, группа «высокоуспешных, дисциплинированных студентов» - высокий критерий и группа «неуспевающих, недисциплинированных студентов» - низкий критерий, а студенты со средними значениями не участвуют в тестировании), проводят тестирование и находят корреляцию между результатами теста и критерием.
высокий критерий | низкий критерий | |
высокий результат теста | a | b |
низкий результат теста | c | d |
Здесь a – число испытуемых, попавших в высокую группу по тесту и по критерию, c – число испытуемых, попавших в высокую группу по критерию и имеющих низкие результаты теста. При полной валидности теста элементы b и c должны быть равны нулю. Меру совпадения, корреляции между крайними группами по тесту и критерию оценивают с помощью фи-коэффициента Гилфорда. Существует достаточно много разных способов доказательства валидности теста. Тест называется валидным, если он измеряет то, для измерения чего предназначен. Валидность внешняя – применительно психодиагностических методик означает соответствие результатов психодиагностики, проводимой посредством данной методики, независимым от методики внешним признакам, относимым к субъекту обследования. Означает примерно то же самое, что валидность эмпирическая, с той разницей, что здесь речь идёт о связи между показателями методики и самыми важными, ключевыми внешними признаками, относимыми к поведению испытуемого. Психодиагностическая методика считается внешне валидной, если, например, её посредством оцениваются черты характера индивида и его внешне наблюдаемое поведение согласуется с результатами проведённого тестирования.
--> ЧИТАТЬ ПОЛНОСТЬЮ <--