Контрольная работа: Информационно-поисковый тузаурус
Введение
1. Информационные системы
2. Информационно-поисковый тезаурус: определение, цель разработки
3. Использование информационно-поисковых тезаурусов
4. Структура информационно-поискового тезауруса
5. Построение информационно-поисковых тезаурусов
6. Сфера применения и перспективы развития информационно-поисковых тезаурусов
Заключение
Литература
Введение
В настоящее время в связи с возрастанием объема документальной информации, необходимой для принятия эффективного управленческого решения, и возможностями, предоставляемыми новыми компьютерными технологиями, автоматизированные информационно-поисковые системы стали широко использоваться в различных сферах экономики.
Организация быстрого и эффективного поиска документальной информации становится все более неразрешимой проблемой.
Цель документального поиска - нахождение и выдача соответствующих запросу пользователя документов или их описаний.
Традиционно информационно-поисковые системы (ИПС) применяются для тематического поиска научно-технической информации в крупных библиотеках, научно-технических центрах, архивах, патентных библиотеках.
Таким образом, сфера приложения для технологий информационно-поисковых систем представляется достаточно широкой.
При автоматизации поиска документальной информации важнейшей является задача формализации содержания документа и запроса. При этом поиск происходит по всему тексту документа или по его поисковому образу, а в качестве запроса чаще всего выступают отдельные ключевые слова или их логические комбинации. Именно на этой технологии основано действие информационно-поискового тезауруса (ИПТ). Цель моей работы – дать необходимые определения, определить цели разработки ИПТ, его структуру и построение, а также значение и перспективы развития.
1. И нформационно-поисковые системы
Автоматизированный документальный поиск может быть организован на основе различных технологий: поиска по поисковому образу документа, поиска по полному тексту документа, поиска документов по гипертекстовым ссылкам.
Технология полнотекстового поиска является неотъемлемой составляющей таких современных и перспективных информационных технологий, как: системы управления документами (Documentmanagementsystem, DMS), технологии групповой работы над документами (groupware), технологии поиска в Internet/intranet. На технологии гипертекста базируется самый известный сервис InternetWorldWideWeb (WWW).
Информационно-поисковая система для управленческих документов, как правило, требует разработки собственного информационно-поискового языка, адекватного данной предметной области.
В документальных информационно-поисковых системах поиск документа происходит по краткому формализованному описанию его содержания - так называемому поисковому образу документа.
Важнейшей структурной составляющей является информационно-поисковый язык.
Информационно-поисковый язык, ИПЯ (indexinglanguage, retrievallanguage) - искусственный язык для выражения содержания документов или запросов с целью последующего поиска.
Основное назначение ИПЯ - установить принадлежность того или иного документа к определенной группе понятий.
Перевод текстов документов и запросов на ИПЯ называется индексированием.
В результате индексирования содержание документа отображается в поисковый образ документа, а содержание запроса - в поисковое предписание.
Индексирование может быть ручным (когда его производит человек) или автоматическим.
Для общения человека с компьютером разрабатываются специальные искусственные языки, естественный язык (ЕЯ) в этом качестве пока не может быть использован без специального предварительного преобразования. В естественном языке присутствуют: синонимия, омонимия и полисемия, избыточность, субъективность и другие свойства, препятствующие его автоматизированной обработке.
Синонимы - слова, различающиеся по написанию, но совпадающие по смыслу (Россия, РФ, Российская Федерация).
Омонимы - слова, совпадающие по звуковому и графическому составу, но имеющие разные значения (ключ может быть - телеграфный, поисковый, к замку, к шкафу и т.д.).
Полисемия - наличие у одного и того же слова нескольких разных, но связанных между собой значений (например: фамилия - как имя и фамилия - как семья).
--> ЧИТАТЬ ПОЛНОСТЬЮ <--