Топик: Лингвистика
опирается на разные аспекты описания, задается так называемая фасетная формула (Ж1 Ц2 Ф1), представляющая собой шаблон, рассматривается класс, аспект предмета
Фасетная классификация: фильмы:
жанр | цвет | формат |
Ж1 Ж2 |
Ц1 цветной Ц2 черно-белый | Ф1 широкоформатный |
фасетная формула: Ж1 Ц2 Ф1
Общие недостатки предкоординированных ИПЯ:
· не позволяют вести поиск по заранее непредусмотренному сочетанию признаков
· все классификации имеют недостаточную глубину
· процесс индексирования принципиально не автоматизирован, т. е ручное индексирование
Посткоординируемые ИПЯ:
семантические коды в ЛЕ в явном виде заданы парадигматические отношения |
дескрипторы оперируют монолитными СЕ, в основу положен принцип координированного индексирования, который выражается в том. что основная тема документа выражается в виде набора слов или СС, т. о документ помещается в n-мерное пространство | |||||
Семантические коды Перри и Кента (США) м.б простыми и составными, простая ЛЕ - сем. множитель; RX коды ручное индексирование |
грамматики мешочного типа (теоретико-множественные грамматики) задаются отношением совместного вхождения в класс, ПОД составляется вручную, ПОД -перечень ключевых слов. |
позиционно-скобочные грамматики сохранение всего исходного текста документа с явным указанием порядка следования, деления на абзацы, предложения: |
сетевые грамматики в явном виде задается смысл связи между элементами текста (Скрэгг) |
ИПЯ с ПСГ:
· индексирование без лексического контроля, до индексирования могут не иметь словаря, словарь формируется в результате индексирования.
· индексирование с лексическим контролем - все словоформы приводятся к стандартному виду