Контрольная работа: Информационно-поисковые тезаурусы
Каждый дескриптор относится только к одной рубрике. Внутри рубрики дескриптор располагается в алфавитном порядке.
Иерархический – представляет собой перечень списков дескрипторов, причём каждый список начинается с дескриптора не имеющего вышестоящих.
После каждого дескриптора приведены непосредственно нижестоящие дескрипторы с указанием иерархических , путём применения нумерации. Либо графические обозначения уровня.
Основные преимущества дескрипторных ИПЯ:
Меньшая по сравнению с классификационным ИПЯ трудоёмкость разработки;
Возможность осуществить поиск по любому заранее заданному сочетанию характеристик входящих в ИПЯ;
Возможность автоматического процесса индексирования документов.
Недостатки дескрипторных ИПЯ:
В основных отраслях характер дескрипторного ИПЯ затрудняет их использование для обмена информацией между системами с различными ИПЯ;
Неадекватное значение термина выбран в качестве дескриптора в различных дескрипторных ИПС.
2. Анализ информационно-поискового тезауруса
2.1 Информационно-поисковый тезаурус по сохранности документов (БАН)
1. Первый отечественный двуязычный тезаурус по сохранности документов, подготовленный в Библиотеке Российской академии наук. тезаурус насчитывает 5 166 терминов.
Издание представляет собой образец смешанного двуязычного (русско-английского) тезауруса. Основным языком выбран английский. Это значит, что в качестве дескрипторов выбраны английские термины, а русские термины приводятся как синонимы.
Настоящий информационно-поисковый тезаурус предназначен для индексирования документов и обработки запросов по обеспечению сохранности (хранению) документов в традиционных и нетрадиционных информационных системах. Тезаурус может использоваться как специальный двуязычный словарь при выполнении переводов с русского на английский и с английского на русский язык, а также как терминологический словарь справочник.
В состав тезауруса входят:
- лексико-семантический указатель;
- иерархический указатель;
- хронологический идентификатор.
2.Дескрипторы часто определяют как классы условной эквивалентности терминов, поскольку имеется поисковая и обычная (общеязыковая) эквивалентность языковых единиц, и эти два вида лексической равнозначности терминов в дескрипторных словарях могут не полностью совпадать. Так, например, у лексических единиц, входящих в дескриптор «DERATISATION c. Дератизация, н. MICE, RATS», содержание понятий «мыши» и «крысы» относятся к семантическим категориям «живые организмы», «биологический фактор», а понятие «дератизация» – к лексической категории «операции». Но поскольку при проведении поиска информации различия в категориальном значении указанных слов являются не очень существенными и более важным является их информационно-поисковая эквивалентность, в тезаурусе по сохранности документов понятия «мыши» и «крысы» являются нижестоящими по отношению к термину «deratisation».
В лексико-семантическом указателе тезауруса расположены дескрипторные и аскрипторные статьи.
В рамках дескрипторной статьи термины располагаются в следующем порядке:
- заглавные дескрипторы выделены заглавными буквами;
- дополнительные данные;
- аскрипторы или дескрипторы синонимы, которые следуют за индексом «с»;
- вышестоящие дискрипторы следующие за индексом «в»;
- нижестоящие дескрипторы следующие за индексом «н».
Пример:
ACCTSS CONTROL