Топик: Лингвистика

опирается на разные аспекты описания, задается так называемая фасетная формула (Ж1 Ц2 Ф1), представляющая собой шаблон, рассматривается класс, аспект предмета


Фасетная классификация: фильмы:

жанр цвет формат

Ж1

Ж2

Ц1 цветной

Ц2 черно-белый

Ф1 широкоформатный

фасетная формула: Ж1 Ц2 Ф1


Общие недостатки предкоординированных ИПЯ:

· не позволяют вести поиск по заранее непредусмотренному сочетанию признаков

· все классификации имеют недостаточную глубину

· процесс индексирования принципиально не автоматизирован, т. е ручное индексирование


Посткоординируемые ИПЯ:


семантические коды

в ЛЕ в явном виде заданы парадигматические отношения


дескрипторы

оперируют монолитными СЕ, в основу положен принцип координированного индексирования, который выражается в том. что основная тема документа выражается в виде набора слов или СС, т. о документ помещается в n-мерное пространство


Семантические коды Перри и Кента (США) м.б простыми и составными, простая ЛЕ - сем. множитель;

RX коды

ручное индексирование

грамматики мешочного типа

(теоретико-множественные грамматики) задаются отношением совместного вхождения в класс, ПОД составляется вручную, ПОД -перечень ключевых слов.

позиционно-скобочные грамматики

сохранение всего исходного текста документа с явным указанием порядка следования, деления на абзацы, предложения:


сетевые грамматики

в явном виде задается смысл связи между элементами текста (Скрэгг)



ИПЯ с ПСГ:

· индексирование без лексического контроля, до индексирования могут не иметь словаря, словарь формируется в результате индексирования.

· индексирование с лексическим контролем - все словоформы приводятся к стандартному виду


4


К-во Просмотров: 732
Бесплатно скачать Топик: Лингвистика