Курсовая работа: Построитель вопросительных предложений

Таким образом, исходный фрагмент текста, поступающий на вход анализатора, недостачею для построения его адекватной семантической модели. Наряду с ним необходимо использовать базу знаний, отражающую как общие, так и специфичные для данной ПО представления. Создание такой базы знаний – непростая задача, на сегодняшний день в полной мере нерешенная.

Исходя из сказанного, мы считаем не рациональным стремиться во что бы то ни стало добиться автоматической Процедуры 1.

Распределение ролей между компьютерной системой и человеком в рамках интерактивной процедуры формирований УТЗ может быть разным. Чем выше степень автоматизации, тем эффективнее инструментарий и тем сложнее его реализация.


1.2 Постановка вопросов к членам предложения

Идея методов генерации вопросов к членам предложения заключается в следующем. Из текста выбирается предложение. Для него составляется грамматическая спецификация, служащая ядром модели задачи. С помощью нее в модели описываются члены предложения, к которым имеет смысл ставить вопросы. Для каждого из них определяется семантический класс, содержащий естественно-языковые выражения, представляющие некорректные альтернативные варианты ответа или его неисключающие компоненты.

По сути формулировка вопроса к какому-то члену предложения строится на основе исходного предложения путем удаления из него данного члена и подчиненных ему синтаксических единиц, добавления вопросительного слова или словосочетания, а также изменения порядка оставшихся членов.

Основные этапы интерактивной процедуры формирования модели УТЗ приведены в таблице 1.

Таблица 1.

Этапы, выполняемые автором

Этапы, выполняемые системой

1. Составление запроса на выборку предложений

2. Анализ текста учебного материала и формирование множества предложений, релевантных запросу

3. Выбор предложения из сформированного множества

4. Обработка предложения с целью упрощения его структуры

5. Составление грамматической спецификации предложения. При необходимости возврат на предыдущий этап для корректировки предложения

6. Выбор членов предложения, к которым имеет смысл ставить вопросы

7. Для каждого выбранного члена указание вопросительного слова или словосочетания. Продолжение работы в рамках процедуры либо выход из нее


Отметим, что не все предложения подходят для генерации вопросов. К потенциально применимым относятся предложения, являющиеся повествовательными, синтаксически членимыми и полными в плане грамматической структуры. Предпочтение при выборе стоит отдавать простым двусоставным предложениям с прямым порядком слов. Осложненные и сложные предложения также могут использоваться, однако сложность их синтаксической структуры необходимо ограничить.

Выбор предложения на третьем этапе производится автором либо реализуется автоматически. Во втором случае критерием служит максимум степени релевантности предложения поисковому запросу.

Обработка предложения на четвертом этапе может включать:

· разбиение сложного предложения на части, соответствующие простым предложениям;

· замена местоимений наименованиями обозначаемых имя сущностей;

· преобразование неполного предложения к эквивалентному ему полному;

· удаление несущественных в смысловом отношении фрагментов;

· раскрытие неоднозначностей, интерпретация которых зависит от контекста.

Развитые программные средства анализа текста, автоматически выполняющие грамматический разбор предложений, могут использоваться на пятом этапе. Вариант разбора, предложенный системой, корректируется и дополняется автором.

Наличие в инструментарии представительного тезауруса позволяет частично автоматизировать решение задач седьмого этапа. Вопросительное слово или словосочетание выбирается в зависимости от типа предложений, грамматической роли члена, к которому ставиться вопрос, типа ассоциируемой с ним предикативной единицы, а также связей между этим членом и другими синтаксическими элементами предложения.

2. Описание алгоритмов решения задачи

2.1 Выделение отдельных членов предложения

Выделение отдельных слов в предложении является простой задачей по поиску лексем в строке. За этот этап отвечает следующий алгоритм:

1. ввод исходной строки;

2. если рассматриваемый символ в строке пробел, то пропускаем все пробелы, пока не встретим букву;

К-во Просмотров: 383
Бесплатно скачать Курсовая работа: Построитель вопросительных предложений