Курсовая работа: Модель диалога человека-преподавателя контролирует деятельность в AutoTutor
AutoTutor – это сплав классических символических структур (например, представления утверждения, концептуальных структур и выбранных правил) и структур, которые имеют многочисленные нечеткие ограничения (например нейросистема, нечеткие продукционные системы). Главные модули AutoTutor включают в себя анимационного агента, учебный план, языковой анализатор, латентный семантический анализ (ЛСА) и генератор шагов диалога. Все модули, кроме одного, были широко описаны в ранних публикациях (см. Foltz, 1996; Graesser, Franclin, Wiemer–Hastings, & the TRG, 1998; Graesser, Wiemer–Hastings, Wiemer–Hastings, Harter, Person & the TRG впечати; Hu, Graesser& the TRG, 1998; Wiemer – Hastings, Graesser Harter,& the TRG, 1998). Исключение составляет генератор шагов диалога. Подробное его описание будет дано после краткого описания остальных модулей.
Главные модули AutoTutor
Анимированный агент
Графическое воплощение AutoTutor было создано в Microsoft Agent. Это двумерное воплащение преподователя, сидящего за столом в течение всего занятия (мы находимся в процессе интеграци трехмерного изображения). AutoTutor общается с обучаемым посредством синтезированной речи, мимики и элементарных направленных жестов. Каждый из этих коммуникационных параметров можно установить на максимизацию общей эффективности AutoTutorа как преподователя и собеседника. Несмотря на то, что об этом можно говорить еще долго, эти механизмы были описаны в других работах (см. McCauley, Gholson, Hu, Graesser and the TRG, 1998; Person, Klettke, Link, Kreuz & the TRG 1999) и находятся вне рамок этой статьи.
Учебный план
Занятие с AutoTutorом проводятся по учебному плану. Учебные планы – это тщательно очерченые свободно структурованные планы занятий, включающие важные концепции, вопросы, факты и проблемы, которые учителя и преподаватели хотят детально осветить на занятии (Graesser & Person, 1994; Graesser et al 1995; McArthur et al. 1990; Putnam, 1987). Учебный план AutoTutor включает 37 вопросов или проблем по компьютерной грамотности: один вводный вопрос (например: «Из каких частей состоит компьютер и где его используют?»), который позволяет студенту привыкнуть к синтезированному голосу, и 36 тематически связанных вопросов/проблем. Учебный план AutoTutorа на данный момент содержит информацию по трем макротемам: комплектующие, операционные системы и Internet. Структура информации по этим темам анологична используемой в курсе компьютерной грамматности и учебнике (Beekman, 1997).
Каждая из 3 макротем содержит 12 тем (всего 36). Эти 36 тем содержат дидактические описания, вопросы, поставленные преподавателем, факты, иллюстрации, диаграммы (вместе с ожидаемыми хорошими и плохими ответами на каждый вопрос/проблему). Каждая из трех макротем имеет 3 уровня сложности и 4 тематических формата. Три уровня сложности (легкий, средний, трудный) наносятся на таксономию когнитивных трудностей и трудности вопросов (Bloom, 1956; Graesser&Person, 1994; Wakefield, 1996). 4 тематических формата представляют собой: (1) Вопрос на серьезное рассуждение; (2) Дидактическая информация + вопрос; (3) Графический дисплей + Вопрос; (4) Проблема + Вопрос.
Учебный план также включает 36 идеальных ответов, которые соответствуют каждой из 36 тем. Идеальный ответ состоит из набора N хороших ответов или аспектов {A1 ,A2 ,….,AN }, которые были определены экспертами в области компьютерной грамотности, число аспектов для каждой темы колеблется от 3 до 9. Прежде чем AutoTutor перейдет к следеующей теме, он должен охватить на занятии все аспекты по данной теме. Качество ответов/реплик обучаемого определяется соответсвием их каждому аспекту и всем возможным комбинациям аспектов в отдельном идеальном ответе. Подобные операции структурного(системного) соответствия выполняет ЛСА (см. следующий раздел).
Дополнительная информация, содержащаяся в учебном планне, включает: (1) ожидаемые плохие ответы для каждой из 36 тем; (2) корректирующие высказывания (напр. хорошие ответы) для каждого из ожидаемых неправильных ответов и (3) многочисленные шаги диалогов (оценки, намеки, подсказки, быстрые отклики и подведение итогов), которые связаны с аспектами идеальных ответов. Надо отметить, что все содержание учебного плана написано на английском языке, в противоположность компьютерному коду. Таким образом, учитель или другой человек, не являющийся опытным программистом, может легко создать учебный план.
Языковые анализаторы
AutoTutor содержит несколько языковых анализаторов, оперирующих словами, которые обучаемый набирает на клавиатуре во время беседы. Анализаторы включают: (1) блок словарной и пунктуационной сегментации; (2) блок идентификации семантических классов и (3) блок классификации разговорных актов. После того, как обучаемый составит фразу и нажмет “ввод”, фраза разбивается на отдельные слова и знаки препинания. Затем идентификатор семантических классов классифицирует каждое слово по большому словарю (около 10 000 слов) и идентифицирует все возможные синтаксические классы и частоту использования слова в английском языке. Например, слово “program” в английском языке является существительным, прилагательным и глаголом. Нейросистема затем определяет верный синтаксический класс слова (W) принимая во внимание синтаксические классы предшествующего (W-1) и последующего (W+1) слова. AutoTutor способен разделять вводимые обучаемым данные на последовательность слов и знаков препинания с точностью 99%, находить нужное семантические классы с точностью 97% и присваивать слову верный семантический класс основываясь на конспекте с точностью 93% (Olde, Hoeffiner, Chipman, Graesser & TRG, 1999)
Классификатор речевых выражений – это нейросеть, которая делит и классифицирует входные данные обучаемого по пяти категориям речевых выражений. Это Утверждение, Расширенный вопрос, Вопрос «да/нет», Указание и Короткий ответ. На данный момент AutoTutor верно классифицирует 89% речевых выражений. В данной версии ЛСА наиболее уместны Утверждения. Т.е. ЛСА используется для оценки качества реплик обучаемого, однажды присвоив ему категорию утверждения. От качества, оцененного ЛСА, зависит тип обратной связи и шага диалога, который AutoTutor будет генерировать после. Для остальных категорий (Расширенный вопрос, Вопрос «да/нет», Указание и Короткий Ответ) AutoTutor использует различные стратегии. Эти стратегии, необходимые для однородности диалога со смешанной инициативной, не будут представлены в этой статье.
Латентный семантический анализ (ЛСА)
Знания системы AutoTutor о компьютерной грамотности отражены в латентном семантическом анализе (ЛСА) (Foltz, 1996; Foltz, Britt & Perfetti, 1996; Landauer & Dumais, 1997; Landauer, Foltz & Laham, 1998). ЛСА - это статистический метод, который сжимает большие массивы в К измерении (обычно от 100 до 500). Для AutoTutorа мы представили ЛСА величиной в 2,3 МБ текстов. Тексты включали учебный план, два учебника комьютерной грамотности и 30 статей, которые обсуждают техническое обеспечение, операционные системы и Internet.
Мы оценивали характеристики ЛСА с размерами, колеблющимися от 100 до 500; для текущей версии AutoTutor мы приняли 200. Размеры ЛСА служат ортогональными факторами, которые используются для вычисления концептуально связанного количества (геометрический косинус между 0 и 1) между двумя некоторыми множествами слов. Количество слов, содержащихся в множестве, варьируется от 1 до бесконечности. Таким ообразом, ЛСА вычисляет концептуальную связь между двумя некоторыми множествами, содержащими одно или более слов. Существует несколько параметров, которые преподаватель отслеживает во время занятий. Эти параметры включают: (1) качество текущего Утверждения обучаемого; (2) количество раскрытых и обсужденных тем и (3) общий уровень способностей обучаемого применительно к материалу данной темы. AutoTutor способен отслеживать эти параметры путем сравнения различных комбинаций реплик обучаемого и преподавателя в диалоге в специфических концептуальных множествах. Для оценки качества Утверждения обучаемого ЛСА сравнивает его с двумя различными концептуальными множествами: множеством, содержащим хорошие ответы и множеством, содержащим плохие ответы. Более высокое значение параметра ЛСА определяет принадлежность Утверждения к тому или иному множеству; т.о. AutoTutor интерпретирует Утверждение обучаемого. В области компьютерной грамотности мы создали свою версию ЛСА, с более аккуратной и точной оценкой качества Утверждения обучаемого (Graesser, et al, в печати; Wiemer-Hastings, Wiemer-Hastings, Graaesser, and the TRG, 1999).
ЛCА также подсчитывает значения двух добавочных параметров: «охват темы» и «уровень студента». «Охват темы» – это коэффициент, который отражает, какая часть Идеального Ответа была раскрыта в обучающем диалоге по конкретной теме (напр. зачем компьютеру нужны внешние периферийные устройства). «Охват темы» содержит предыдущие реплики преподавателя и обучаемого, сравниваемые с концептуальным множеством, содержащим Идеальный Ответ. «Уровень студента» – просто коэффициент, отражающий уровень способностей студента в рамках конкретной темы. Таким образом, с множеством Идеальных Ответов сравниваются только предыдущие реплики студента. Набор продукционных правил, которые диктуют следующее действие AutoTutor, основан на заранее установленных значениях трех параметров ЛСА, описанных в этом разделе; качества реплики студента, охвата темы и уровня студента. Эти продукционные правила обрисованы в следующем разделе.
Генератор шагов диалога
AutoTutor создан для воспроизведения шагов диалога обычных преподавателей. В идеале мы хотели, чтобы AutoTutor воспроизводил шаги диалога, имеющие педагогическую ценность, учитывающие способности обучаемого и соответствующие разговорному контексту. Текущая версия AutoTutor имеет репертуар из 12 типов шагов диалога, которые контролируются генератором шагов диалога (их описание дано в предыдущем разделе). Это стимулирование, поощрительное стимулирование, намек, поправка, подсказка, оценка и подведение итогов и пять форм немедленной короткой обратной связи (положительная, положительно-нейтральная, нейтральная, отрицательно-нейтральная и отрицательная). Эти 12 типов шагов диалога генерируются в ответ на реплики обучаемого, которые классифицируются как Утверждения классификатором речевых выражений. К Утверждениям обучаемого применяют специальный подход по двум причинам: (1) Утверждения обучаемого больше говорят о способностях студента, чем его вопросы (Person et al, 1995) и (2) Утверждения обучаемого встречаются чаще в обучающих диалогах, чем в других речевых актах, в частности в вопросах (Graesser & Person, 1994). AutoTutor оборудован механизмами управления остальными категориями речевых актов (расширенный вопрос, вопрос «да/нет», указание и короткий ответ). Например, в случае расширенного вопроса (например «что значит Х?») Х сравнивается со статьями словаря и AutoTutor дает определение в случае высокого уровня соответствия. Эти механизмы находятся вне рамок данной статьи и поэтому не рассматриваются.
Генератор шагов диалога управляется 15 нечеткими продукционными правилами, которые прежде всего разрабатывают данные, предоставленные модулем ЛСА. Каждое нечеткое правило указывает значение параметров, при которых должен быть начат конкретный шаг диалога. Таким образом, AutoTutor адаптировал структуру традиционных продукционных правил за исключением параметров, которые оценены нечеткими соответствиями (Kosko, 1992). Продукционные правила живых диалогов сосредоточены на следующих четырех параметрах: (a) качество утверждений обучаемого при предыдущем повторе разговора, (b) уровень знаний студента по данной теме, (c) степень охвата темы и (d) многословность студента. Значения первых трех параметров сосчитаны ЛСА, а четвертый (многословность студента) – просто измерение того, насколько активно (…) студент участвует в обсуждении темы. Продукционные правила живого диалога приведены ниже.
Стимулирование | Pump |
ЕСЛИ (раскрытие темы - НИЗКОЕ или СРЕДНЕЕ после первого утверждения обучаемого) ТОГДА (выбор стимулирования) | 1. IF (topic coverage = LOW or MEDIUM after learner’s first Assertion) THEN (select PUMP) |
2 ЕСЛИ (соответствие множеству хороших ответов – СРЕДНЕЕ или ВЫСОКОЕ и раскрытие темы – НИЗКОЕ или СРЕДНЕЕ) ТОГДА (выбор стимулирования) | 2. IF (match with good answer bag = MEDIUM or HIGH & topic coverage = LOW or MEDIUM) THEN (select PUMP) |
Положительное стимулирование | Positive pump |
ЕСЛИ (раскрытие темы - ВЫСОКОЕ после первого утверждения обучаемого) ТОГДА (выбор положительного стимулирования) | IF (topic coverage = HIGH after learner’s first Assertion) THEN (select POSITIVE PUMP) |
Коррекция | Splice |
ЕСЛИ (уровень студента - НИЗКИЙ или СРЕДНИЙ и многословность студента - НИЗКАЯ или СРЕДНЯЯ и раскрытие темы - НИЗКОЕ или СРЕДНЕЕ и соответствие множеству плохих ответов - ВЫСОКОЕ) ТОГДА (выбор коррекции) | 4. IF (student ability = LOW or MEDIUM & student verbosity = LOW or MEDIUM & match with bad answer bag = HIGH) THEN (select splice) |
Подсказка | Prompt |
ЕСЛИ (многословность студента – НИЗКАЯ и раскрытие темы - НИЗКОЕ или СРЕДНЕЕ) ТОГДА (выбор подсказки) | 5. IF (student verbosity = LOW & topic coverage = LOW or MEDIUM) THEN (select prompt) |
Намек | Hint |
ЕСЛИ (уровень студента - СРЕДНИЙ или ВЫСОКИЙ и соответствие множеству плохих ответов - НИЗКОЕ) ТОГДА (выбор намека) | 6. IF (student ability = MEDIUM or HIGH & match with good answer bag = LOW) THEN (select hint) |
7. ЕСЛИ (уровень студента - НИЗКИЙ и многословность студента - ВЫСОКАЯ и соответствует множеству хороших ответов - НИЗКОЕ) ТОГДА (выбор совета) | IF (student ability = LOW & student verbosity = HIGH & match with good answer bag = LOW) THEN (select hint) |
Подведение итогов | Summary |
ЕСЛИ (раскрытие темы - ВЫСОКОЕ или число повторов - ВЫСОКОЕ) ТОГДА (выбор подведения итогов) | 8. IF (topic coverage = HIGH or number of turns = HIGH) THEN (select summary) |
Оценки | Elaborations |
ЕСЛИ (раскрытие темы - СРЕДНЕЕ или БЛИЗКО К ВЫСОКОМУ) ТОГДА (выбор оценки) | 9. IF (topic coverage = MEDIUM or SOMEWHAT HIGH) THEN (select elaborate) |
Положительная обратная связь | Positive feedback |
ЕСЛИ (соответствие множеству хороших ответов –ВЫСОКОЕ или ОЧЕНЬВЫСОКОЕ) ТОГДА (выбор положительной обратной связи) | 10. IF (match with good answer bag = HIGH or VERY HIGH) THEN (select positive feedback) |
Отрицательная обратная связь | Negative feedback |
ЕСЛИ (соответствие множеству плохих ответов –ВЫСОКОЕ или ОЧЕНЬ ВЫСОКОЕ и раскрытие темы - СРЕДНЕЕ или ВЫСОКОЕ) ТОГДА (выбор отрицательной обратной связи) | 11. IF (match with good answer bag = HIGH or VERY HIGH & topic coverage = MEDIUM or HIGH) THEN (select negative feedback) |
Нейтральная обратная связь | Neutral feedback |
ЕСЛИ (соответствие множеству хороших ответов – СРЕДНЕЕ или БЛИЗКО К ВЫСОКОМУ) ТОГДА (выбор положительно – нейтральной обратной связи) | 12. IF (match with good answer bag = HIGH or SOMEWHAT HIGH) THEN (select positive neutral feedback) |
13. ЕСЛИ (соответствие множеству плохих ответов – БЛИЗКО К ВЫСОКОМУ) ТОГДА (выбор отрицательно–нейтральной обратной связи) | 13. IF (match with bad answer bag = SOMEWHAT HIGH) THEN (select negative neutral feedback) |
ЕСЛИ (соответствие множеству плохих ответов –ВЫСОКОЕ или ОЧЕНЬ ВЫСОКОЕ и раскрытие темы - НИЗКОЕ) ТОГДА (выбор отрицательно–нейтральной обратной связи) | 14. IF (match with bad answer bag = HIGH & topic coverage = LOW) THEN (select negative neutral feedback) |
ЕСЛИ (соответствие множеству хороших ответов – НИЗКОЕ или СРЕДНЕЕ) ТОГДА (выбор нейтральной обратной связи) | 15. IF (match with good answer bag = LOW or MEDIUM) THEN (select neutral feedback) |
(Примечание: это те продукционные правила шагов диалога, которые существуют в текущей версии AutoTutor. Они были пересмотрены после трех циклов оценок).
Для того, чтобы понять эти продукционные правила, некоторые общие значения ЛСА (напр. Низкий, Средний, Высокий) нуждаются в дальнейшем уточнении. Напомним, что значение ЛСА – есть геометрические косинусы, которые колеблются между 0 и 1, где более высокие значения показывают большее концептуальное совпадение. Характерные значения, установленные в продукционных правилах (например, Средний, Низкий, Высокий), сообщаются в пределах произвольно обусловленных значений ЛСА. В AutoTutor значению «Высокий» соответствуют значения ЛСА, колеблющиеся между 0,5 и 1, а, значению «Средний» соответствует значения ЛСА, колеблющиеся между 0,25 и 0,75. Частичное совпадение значений ЛСА (напр. Средний и Высокий) является неотъемлемой частью нечеткой логики (см. Kosko, 1992). Шаги диалога AutoTutor были оценены в трех различных циклах. Границы значений, которые могут принимать параметры ЛСА, были слегка подогнаны после каждого цикла оценок, чтобы улучшить характеристики AutoTutor.
Некоторые шаги диалога имели более одного продукционного правила. Это – причина того, что многие живые диалоги выполняли более одной педагогической функции. Рассмотрим два продукционных правила намека. В правиле (6) студент со средним или высоким уровнем способностей ошибся и выдал Утверждение низкого качества. В данном случае намек поможет студенту вернуться на правильный путь. В правиле (7) активный студент низким уровнем способностей выдает Утверждение низкого качества. Здесь ему дается возможность повысить качество Утверждения, перед тем, как преподаватель даст необходимую информацию. Таким образом, это правило побуждает студента выдавать Утверждения высокого качества раньше преподавателя (что будет педагогически худшей стратегией).
Оценка характеристик AutoTutor
Для того, чтобы оценить характеристики AutoTutorа как эффективного преподавателя и собеседника, мы провели три цикла оценок. Целью этих циклов было идентифицировать и исправить недочеты шагов диалога прежде, чем AutoTutor предстанет перед обучаемыми. Для подражания людям-студентам различного уровня способностей и многословности было создано несколько виртуальных студентов. Использование виртуальных (или синтетических) студентов для тестирования обучающих систем встречается довольно часто и поддерживается другими исследователями(Ur & Vanleh, 1995; VanLehn, Ohlsson & Nason, 1994). Эксперты по языку и педагогике оценивали педагогическую эффективность и разговорное соответствие шагов диалога AutoTutor во время занятий с виртуальными студентами. После каждого цикла оценок учебный план, нечеткие продукционные правила и пороговые параметры ЛСА пересматривались, чтобы улучшить характеристики AutoTutor.
Виртуальные студенты
Для оценки эффективности AutoTutor во время фазы разработки мы создали различные типы виртуальных студентов. Каждый из виртуальных студентов отличался по уровню способностей и/или стилю речи. Для создания виртуальных студентов 100 обычным студентам, записавшимся на курс компьютерной грамотности, было задано 36 вопросов по темам учебного плана. Затем эксперты оценили качество ответов студентов на каждый из 36 вопросов. Для каждой из 36 тем учебного плана были созданы следующие студенты:
Хороший многословный студент. Первые 5 реплик этого виртуального студента содержали 2 или 3 Утверждения, которые эксперты оценили как хорошие Утверждения из человеческих примеров. Студент рассматривался как многословный, поскольку студент имел 2 или 3 утверждения в течение одной реплики, что больше, чем среднее количество Утверждений на 1 реплику в человеческом преподавании.
Хороший краткий студент. Первые 5 реплик этого виртуального студента содержали 1 Утверждение, которое эксперты оценили как хорошее Утверждение.
Средний студент. Первые 5 реплик этого виртуального студента содержали Утверждение, которое эксперты оценили как среднее (ни хорошее, ни плохое).
Ошибающийся студент. Первые 5 реплик этого виртуального студент содержали утверждения, содержащее недопонимание или ошибки, согласно заключениям людей-экспертов.