Информатика / Реферат: Компьютерная лингвистика как прикладная лингвистическая дисциплина

Реферат: Компьютерная лингвистика как прикладная лингвистическая дисциплина

отлучение персонажа сказки из дома;

запрет герою на действие;

нарушение запрета;

получение вредителем информации о жертве;

обман жертвы вредителем;

невольное пособничество жертвы вредителю и т.д.

Идеи Проппа легли в основу компьютерной программы TALE, моделирующей порождение сюжета сказки. В основу алгоритма программы TALE положена последовательность функций персонажей сказки. Фактически функции Проппа задавали множество типизированных ситуаций, упорядоченных на основе анализа эмпирического материала. Возможности сцепления различных ситуаций в правилах порождения определялись типичной последовательностью функций - в том виде, в котором это удается установить из текстов сказок. В программе типичные последовательности функций описывались как типовые сценарии встреч персонажей.

В дальнейшем система была усложнена за счет введения модели мира сказки, география которого состоит из обычного мира, промежуточного (среднего) мира и иного мира [Гаазе-Рапопорт, Поспелов, Семенова 1984]. Каждый мир состоит из локусов, связанных между собой определенными отношениями. Отношения связывают не только локусы внутри каждого мира, но и локусы различных миров. Обычный мир состоит из следующих локусов: место проживания героя (локус 1), место получения задания (локус Г), место дарения волшебных предметов, помогающих выполнить задание. Первый локус и локус штрих часто совпадают (ср. сказки о Падчерице и злой Мачехе). К обычному миру относятся также локусы 3 (их может быть много), в которых преодолеваются препятствия с помощью волшебных предметов. Количество препятствий, как правило, совпадает с количеством волшебных предметов. После преодоления препятствий герой оказывается в промежуточном мире, стражем которого является Баба-Яга. Средний мир отделяет мир героев от мира антигероев. Функции Бабы-Яги различаются - она может выступать как дарительница информации или очередного волшебного средства, а может выступать на стороне антигероев (например, при акценте на людоедском поведении Бабы-Яги). Иной мир включает место обитания антигероя (локус 5), место битвы между героем и антигероем (локус 6) и, наконец, локус 7 - место награды или цели, которой добивается герой. Локусы связаны отношениями перехода, которые представляют возможные последовательности развертывания сюжета.

Модифицированная версия программы TALE имеет следующую блок-схему [Гаазе-Рапопорт, Поспелов, Семенова 1984, с.52]:

Блок-схема программы TALE

Работа программы начинается с первого блока, в котором выбирается тип сюжета сказки и ее персонажи. Здесь же формируется экспозиция сказки (setting). Во втором блоке хранятся описания, связанные с персонажами, а в четвертом - постоянные характеристики персонажей. Описания даются во фреймоподобных структурах представления знаний. С помощью второго и третьего блоков формируются мотивы и поступки персонажей. Третий блок задает последовательность движения персонажей по локусам. В последнем (шестом) блоке происходит сборка порожденных фрагментов сказки.

Блок-схема модифицированного варианта программы TALE показывает, что чисто "морфологического" подхода к структуре сюжета сказки явно недостаточно. "Морфемы" сказочного сюжета должны не только определенным образом сочетаться между собой, но и иметь специфические ограничения на сочетаемость. Фиксация одного типичного порядка следования функций персонажей волшебной сказки существенно ограничивает имеющиеся возможности сочетаемости. Более адекватное решение этой проблемы дает синтаксический подход к структуре сюжета.

"Синтаксис" сюжета . Теоретическую основу синтаксического подхода к сюжету текста составили "сюжетные грамматики" (story grammars). Сюжетные грамматики появились в середине 70-х гг. в результате переноса идей порождающей грамматики Н. Хомского на описание макроструктуры текста. Если важнейшими составляющими синтаксической структуры в порождающей грамматике были глагольные и именные группы, то в большинстве сюжетных грамматик в качестве базовых выделялись экспозиция (setting), событие и эпизод. В теории сюжетных грамматик широко обсуждались условия минимальности: ограничения, определявшие статус последовательности из элементов сюжета как нормальный сюжет. Оказалось, однако, что чисто лингвистическими методами это сделать невозможно. Многие ограничения носят социокультурный характер. Сюжетные грамматики, существенно различаясь набором категорий в дереве порождения, допускали весьма ограниченный набор правил модификации нарративной структуры. В подавляющем большинстве случаев эти правила заимствованы из той же порождающей грамматики. Потенциал варьирования структуры сюжета обеспечивается в первую очередь трансформациями передвижения и опущения. Например, текст признания преступника, фиксирующий реальную последовательность развертывания событий в преступлении, можно с помощью перестановок и опущений преобразовать в детективный сюжет: {преступник → замысел → орудие убийства → место → убийство → обнаружение трупа → поиски преступника} → {обнаружение трупа → обнаружение орудия убийства → поиски преступника}.

Использование сюжетных грамматик в компьютерном моделировании оказалось не вполне удачным. Синтактический компонент сюжета, описываемый грамматиками, отражает чисто внешние особенности текста. Не удается обнаружить операциональные критерии выделения различных составляющих сюжета.

Основной вывод дискуссии о недостатках сюжетных грамматик свелся к необходимости описания сюжета в рамках структуры целесообразной деятельности, то есть с привлечением категорий "цель", "проблема", "план" и т.д. Иными словами, метаязыка, учитывающего только внешние особенности сюжета, явно недостаточно. Необходимо обращение к когнитивным состояниям персонажей.

Когнитивный подход к сюжету. В начале 80-х гг. одной из учениц Р. Шенка - В. Ленерт - в рамках работ по созданию компьютерного генератора сюжетов был предложен оригинальный формализм аффективных сюжетных единиц (АСЕ - Affective Plot Units), оказавшийся мощным средством представления структуры сюжета [Lehnert 1982]. При том, что он был изначально разработан для системы ИИ, этот формализм использовался в чисто теоретических исследованиях. Сущность подхода Ленерт заключалась в том, что сюжет описывался как последовательная смена когнитивно-эмоциональных (аффективных) состояний персонажей. Тем самым в центре внимания формализма Ленерт стоят не внешние компоненты сюжета - экспозиция, событие, эпизод, мораль - а его содержательные характеристики. В этом отношении формализм Ленерт отчасти оказывается возвращением к идеям Проппа.

Каждая аффективная сюжетная единица представляет собой бинарное отношение, связывающее некоторые события, оцениваемые персонажами положительно (+) или отрицательно (-), и когнитивно-эмоциональные состояния персонажей (в различных комбинациях - событие & состояние; событие & событие и т.д.). Бинарное отношение не однородно. Всего выделяется пять типов бинарных отношений, специфицируемых в каждой аффективной сюжетной единице. Бинарное отношение может быть мотивацией (обозначение - т), актуализацией (а), прекращением одного действия другим (t), эквивалентностью (е), а также аффективной каузальной связью между персонажами. Каждая аффективная сюжетная единица получает название, например, УСПЕХ, НЕУДАЧА, УПОРСТВО, ПРОБЛЕМА и т.д.

4. Гипертекстовые технологии представления текста

Феномен гипертекста можно обсуждать с нескольких точек зрения. С одной стороны, это особый способ представления, организации текста, с другой - новый вид текста, противопоставленный по многим своим свойствам обычному тексту, сформированному в гутенберговской традиции книгопечатания. И, наконец, это новый способ, инструмент и новая технология понимания текста.

Теоретические основания гипертекста . Многие исследователи рассматривают создание гипертекста как начало новой информационной эпохи, противопоставленной эре книгопечатания. Линейность письма, внешне отражающая линейность речи, оказывается фундаментальной категорией, ограничивающей мышление человека и понимание текста. Мир смысла нелинеен, поэтому сжатие смысловой информации в линейном речевом отрезке требует использования специальных "коммуникативных упаковок" - членение на тему и рему, разделение плана содержания высказывания на эксплицитные (утверждение, пропозиция, фокус) и имплицитные (пресуппозиция, следствие, импликатура дискурса) слои. Отказ от линейности текста и в процессе его представления читателю (чтения и понимания), и в процессе синтеза, по мнению теоретиков, способствовал бы "освобождению" мышления и даже возникновению его новых форм.

Прототипический текст - это монолог. Между тем многие лингвисты (и среди них М. Бахтин и Л. Якубинский) указывали на вторичность монолога по сравнению с диалогом. Гипертекст с этой точки зрения позволяет устранить искусственную монологичность текста.

Обычный текст, как правило, имеет автора. Гипертекст автора в традиционном понимании не имеет - у него множество авторов, причем для постоянно изменяющегося гипертекста авторский коллектив также постоянно меняется. Изменение статуса автора меняет и статус читателя: в гипертекстовой системе понимание часто сопровождается изменением компонентов гипертекста или, как минимум, выбором пути просмотра, что опять-таки акт творческий, авторский.

Множественность авторства имеет и еще одно следствие: в гипертексте представлено много точек зрения на проблему, а в обычном тексте - только одна. Именно поэтому гипертекст более объективен и более толерантен к читателю, чем классический текст.

Гипертекстовые технологии позволяют легко сочетать различные виды информации - обычный текст, рисунок, график, таблицу, схему, звук и движущееся изображение. Как традиционный текст, так и гипертекст - феномены, порожденн?

К-во Просмотров: 430

Бесплатно скачать Реферат: Компьютерная лингвистика как прикладная лингвистическая дисциплина

>>> Скачать <<<