Топик: Лингвистика

2. Автоматизированные информационно-поисковые системы: их структуры, функции, критерии оценки. Информационные языки.


АИПС предназначены для инф. обслуживания пользователей информации в заданной тематической области.


2 основные задачи АИПС:

· хранение информации

· поиск и выдача информации


Из сведений о ТО. поступающих на хранение в систему формируется информационный массив (ИМ). От потребителя поступают запросы, и система ищет сведения в ИМ, Соответствующие данному запросу. Всякая поисковая операция в системе сводится к сравнению поступившего запроса с имеющимися в системе сведениями. в современных ИПС все это происходит автоматически. Для этого и запрос и сведения должны быть представлены на таком языке, который обладает смысловой однозначностью - ИПЯ.


Индексирование - перевод содержания текста, хранящегося в ИМ на ИПЯ. в результате индексирования образуется поисковый образ, у документа - ПОД, у запроса - ПОЗ.


Критерий смыслового соответствия - мера соответствия между содержанием запроса и документа, достаточная для признания данного документа релевантным данному запросу. Вводится совокупность признаков, на основании которых устанавливается степень необходимого и достаточного соответствия между поисковым предписанием и поисковым образом документа, выраженными на одном и том же ИПЯ.


Результатом поисковой операции является выборка релевантных ПОДов.


Абстрактная ИПС - некий логико-семантический аппарат, состоящий из ИПС, правил индексирования и критерия выдачи.


В зависимости от характера сведений и запроса различаются документальная и фактографическая ИПС. Фактографическая ИПС не хранит документы, а только факты. Документальная хранит документы. Но существует прием, позволяющий в процессе поиска определенного документа извлекать факт: В документальной системе хранится информация о содержании документа + документографическая информация (автор, год ...)


выделение нужной пользователю информации осложняется двумя обстоятельствами:

· несоответствие между формулировкой запроса и реальной информацией нужной потребителю

· перевод запроса в ПОЗ


Мера соответствия документа информационной потребности называется пертенетностью.

Соответствие документа запросу называется релевантностью:

· смысловая (соответствие запроса поисковому предписанию) - просто релевантность, зависит от ИПЯ (его семантической силы, глубины индексирования, совершенства логико-сем. аппарата)

· формальная (соответствие документа поисковому предписанию)


ИПЯ - специализированный ИЯ, предназначенный для эксплицитной записи содержания документов и запросов в форме, удобной для автоматического поиска.


Классификация ИПЯ:


предкоординированные ИПЯ

присутствует заранее заданная классификационная схема

посткоординируемые ИПЯ

отсутствует заранее заданная классификационная схема


Типы классификаций


иерархическая

задает дерево знаний, например всей литературы по лингвистике

алфавитно-предметная

например, телефонный справочник

К-во Просмотров: 727
Бесплатно скачать Топик: Лингвистика