Контрольная работа: Информационно-поисковые тезаурусы
1. Информационно-посковый тезаурус
Словари типа тезаурус или идеографические впервые разработаны в лингвистике. Тезаурусы предназначены для облегчения поиска языковых средств выражающих данное понятие (идею). Классическим примером поискового тезауруса является: тезаурус английских слов и выражений первое издание которого было подготовлено Роджестоном 1852 г. подобные тезаурусы созданы и для других естественных языков. Лингвистический тезаурус разработан в связи с автоматизированной подготовкой текста.
Синтагматические связи – это соотношение единицы языка в данном высказывании.
В институте русского языка РАН создан тезаурус семантических (смысловых) и синтагматических связей между словами и словосочетаниями , русский язык как словарно-программное средство. Объём тезауруса 64 000 слов и словосочетаний.
ИПТ предназначен:
1. обеспечивать перевод с естественного языка на дескрипторный т.е для координатного индексирования документов и запросов.
2. отражать парадигматические отношения между лексическими единицами ИПТ, которые используются при составлении стратегии поиска.
Парадигматические отношения- это логические и ассоциативные отношения между ЛЕ ИПЯ.
3. служить терминологическим пособием.
ИПТ – это нормативный словарь дескрипторного ИПЯ с зафиксированными в нём парадигматическими отношениями ЛЕ.
Многоязычный ИПТ – это ИПТ содержащие ЛЕ взятые из нескольких естественных языков и представляющий эквивалентные по смыслу понятия на каждом из этих языков.
Целью создания ИПТ является повышение показателя поиска информации в ИПТ.
Макротезаурус – ИПТ включающий ЛЕ высокой общности и покрывающий широкую область знания.
Микротезаурус – специализированный ИПТ небольшого объёма составленный на основе выборки из более полного ИПТ и дополнительно включающий конкретные русские понятия определённой тематики.
Специализированный ИПТ или синоним монотематического ИПТ – ИПТ построенный для отражения области знания или практической деятельности.
Политематический ИПТ – ИПТ построенный для широкой совокупности областей знания.
Специализированный ИПТ – существует в большинстве науки и техники.
Количество разработанных микротезаурусов исчисляется только в нашей стране в несколько тысяч.
Макротезаурус и политематический ИПТ – предназначены для использования лексико-тематической основы при построении микротезауруса.
Политематический ИПТ включает только основную лексику той или иной отрасли и наиболее очевидные парадигматические отношения.
Микротезаурус включает специфические термины собствен. наимен. и развитую парадигмат.
В состав ИПТ входит вводная часть, основная часть (лексико-семантический указатель) и дополнительные части.
Вводная часть включает титульный лист и текстовые введения.
Введение содержит следующие данные:
1. цель создания и область применения ИПТ;
2. ссылки на источники используемые для сбора лексики ИПТ (др. ИПТ, терминологические словари);
3. описание порядка составления ИПТ;
4. описание состава и структуры ИПТ;
5. количественные характеристики ИПТ (общее число статей, число дескрипторов и аскрипторов);
--> ЧИТАТЬ ПОЛНОСТЬЮ <--