Реферат: Методика составления тестовых заданий по курсу Механика
Проектирование модели знаний играет важную роль для образовательного процесса. От этого, в конечном счете, зависит обучающая среда: преподаватель с его квалификацией и опытом, средства и технологии обучения, а главное – контроль обучения с помощью компьютерных тестов.
Главная цель тестирования – обнаружение взаимного несоответствия этих моделей и оценка уровня их несоответствия.
Сложной задачей эксперта по контролю является задача разработки тестовых заданий, которые позволяют максимально объективно оценить уровень соответствия или несоответствия педагогической модели знаний и личностной модели знаний.
Построение компьютерных тестов можно осуществить по следующим последовательным шагам:
1. формализация экспертной целевой модели знаний;
2. нисходящее проектирование тестового пространства;
3. формирование и наполнение тестовых заданий;
4. формирование полного компьютерного теста;
5. тестовый эксперимент;
6. выбор эффективного теста;
7. анализ, корректировка и доводка теста до вида эксплуатации.
На рис.1.1 приводится схема создания теста. Множество тестовых заданий (тестовое пространство), согласно принципу исчерпывающего тестирования, вообще говоря, может быть бесконечным. Однако очевидно, что существует конечное подмножество тестовых заданий, использование которых позволяет с большой вероятной точностью оценить соответствие личностной модели знаний экспертным моделям знаний (полный тест). Важнейшим элементом в подготовке тестов выступает класс эквивалентности тестовых заданий.
Для создания тестов по предметной области существуют и разрабатываются специальные инструментальные программы-оболочки, позволяющие
вырабатывать компьютерные тесты путём формирования базы данных из набора тестовых заданий.
В большинстве случаев тестовые оболочки (ТО) построены на принципах однозначного распознавания ответов тестируемого: выбор, шаблонный ответ, конструирование ответа.
Другим важным свойством ТО должно быть наличие возможности передачи результатов и протокола тестирования какому-либо статистическому пакету для дальнейшей обработки, что в некоторых существующих ТО представлено неполно.[5]
1.3. Критерии качества тестов
Научно обоснованный тест – это метод, соответствующий установленным стандартам надежности и валидности.
Традиционно выделяются два основных критерия качества тестов. Первый из них связан с понятием точности измерений и известен, главным, образом, в виде понятия надежности теста .
Качество педагогического контроля в вузе зависит не только от надежности используемых методов, но и от их валидности. Валидность теста — его пригодность для достижения поставленной цели: пригодность по содержанию, пригодность к применению в конкретных обстоятельствах, пригодность по какому-либо критерию или, что то же самое, характеристика его способности изучать то, что он должен изучать по замыслу авторов.[1]
1.3.1. Надежность тестов.
Существует несколько практических способов определения надежности теста. Самый безупречный со статистической точки зрения метод определения надежности – это коррелирование двух параллельных тестов, созданных для измерения одного и того же свойства.
Суть корреляции состоит в том, что из полученной каждым студентом суммы баллов вычитается ровно то число, которое может быть угадано в соответствии с теорией вероятностей. Корреляция осуществляется с помощью соотношения:
,
где - скорректированный на догадку тестовый балл испытуемого;
- число правильных ответов, полученных испытуемым в тесте;
- число неправильных ответов;
- число готовых ответов в заданиях теста.
Эта формула применяется к заданиям с одинаковым числом готовых ответов.
Интуитивно наиболее понятный и простой способ определения надежности теста – это двукратное, по меньшей мере, использование одного и того же теста в той же самой группе студентов. Результаты обоих опросов анализируются с целью поиска корреляции между ними. Данный метод имеет свои достоинства и недостатки. Достоинства заключаются в сравнительной простоте его использования, ясности основных посылок, лежащих в определении надежности, простоте расчетов. К недостаткам можно отнести неопределенность в выборе временного интервала между первым и вторым опросами. Этот интервал может колебаться от нескольких минут до нескольких дней, месяцев и даже лет.
Надежность тестов достаточно просто оценить в гомогенных тестах. Однако, оценка надежности заметно осложняется в гетерогенных тестах. Осложнение вызвано главным образом некоррелируемостью (или слабой коррелируемостью) гомогенных тестов между собой. Соответственно ответы студентов на задания одного гомогенного теста, как правило, редко коррелируют с ответами на задания другого. Отсутствие же корреляции мешает всякой надежде на мало-мальски заметную надежность теста в целом.
Все методы оценки надежности теста основаны на разных теоретических положениях, но все они призваны ответить на один и тот же вопрос – насколько точны проведенные измерения? Само понятие "точность" в каждом случае оценки приобретает несколько отличающийся смысл.