Реферат: Модели знаний и данных
системы управления базами данных,
сеть Internet.
В последние два десятилетия широкое распространение в различных областях деятельности получили экспертные системы. Отличительной чертой компьютерных программ, называемых экспертными системами, является их способность накапливать знания и опыт высоко квалифицированных специалистов в какой-либо узкой предметной области. Затем с помощью этих знаний пользователи экспертных систем, имеющие не очень высокую квалификацию, могут решать свои текущие задачи столь же успешно, как это сделали бы сами эксперты. На данный момент экспертные системы должны удовлетворять следующим требованиям :
1.Необходимо использовать в них не поверхностные знания в виде эвристических правил, а глубинные, представляющие собой теории предметных областей и общие стратегии решения проблем.
2.Знания должны быть организованы в виде составных иерархических представлений, включающих сети фреймов, продукции и логические модели.
3.Экспертная система должна решать задачи из динамических предметных областей, то есть областей, знания о которых могут изменяться непосредственно в процессе вывода.
4.Одним из компонентов экспертной системы должна являться база данных с неполной информацией.
5.Система должна быть способна анализировать имеющиеся у нее знания, обнаруживая противоречия между старыми знаниями и вновь полученными от эксперта, устанавливать факт их неполноты или ошибочности.
В большинстве случаев современные экспертные системы не удовлетворяют этим требованиям. Следует сказать о таком важном, недостатке экспертных систем, как отсутствие возможности хранить большие объемы данных. Конечно, в принципе база знаний экспертной системы может хранить любое количество данных в виде правил-продукций или просто фактов. Но механизм ее работы в общем виде таков, что при работе с большими объемами похожих фактов или правил скорость работы резко падает.
Остановимся теперь на средствах управления базами данных. Не секрет, что в связи с ростом объемов носителей и скоростей передачи данных человечество просто тонет в огромном количестве информации. Все знания, которыми когда-либо обладал человек если уже не хранятся, то в ближайшем будущем будут храниться в компьютеризированном виде. Таким образом, если человеку нужна какая-либо конкретная информация, он может быть уверен, что где-то, на каком-то сервере и в какой-то базе данных эта информация уже хранится. Нужно только извлечь ее. Дальше начинаются сложности. Пользователь должен знать не только точный адрес нужного сервера, но и представлять себе, где именно на этом сервере и в каком виде хранится нужная ему информация. И это еще не все. Человек должен суметь сформулировать свой вопрос на языке, прямо скажем, далеком от естественного, например, на языке SQL. Только тогда он сможет добраться до нужной информации.
Примерно тем же недостатком обладают средства поиска информации в сети Internet. Поисковые машины Internet ни в коей мере не используют семантику предметной области при поиске информации, а могут искать информацию только по ключевым словам, подбор которых является для пользователя отнюдь не тривиальной задачей. Кроме того, даже зная какие слова нужно искать, пользователь не гарантирует себе успешный поиск, т.к. не знает в каком падеже используются эти слова.
Итак: Экспертная система способна выдавать ответы, выбирая их из собственной базы знаний или выводя с помощью правил-продукций, но не имеет доступ к огромным массивам информации, хранящимся в базах данных различного типа.
Средства управления базами данных, например, SQL-сервера, способны выдавать только конкретную информацию по конкретным запросам, сформулированным на соответствующем языке. Делать выводы и самообучаться они не могут.
Средства поиска информации в Internet не способны гарантировать успех, т.к. не используют при поиске семантику предметной области.
Таким образом, мы пришли к выводу, что ни базы знаний с инструментарием экспертной системы, ни базы данных с языками запросов, ни поисковые машины Internet неискушенного человека удовлетворить не могут. Тогда и возникла идея объединить базы данных и базы знаний едиными концепциями и единым инструментарием и погрузить их в среду Internet / Intranet .
Язык представления данных и знаний IRL.
В качестве модели представления данных и знаний была выбрана сеть фреймов. Понятие фрейма широко используется в областях, связанных с искусственным интеллектом. Фрейм позволяет описывать как абстрактные объекты и понятия, так и конкретные объекты, имеющие точные числовые характеристики. Также представляется очень существенной возможность представления в виде фреймов иерархических объектов. Фрейм, как известно, состоит из слотов, описывающих конкретные свойства понятия или объекта. Для работы с фреймами был разработан специальный язык, названный нами Intelligent Request Language, или сокращенно IRL. Грамматика этого языка представлена ниже. Она относится к классу Q-грамматик, так как содержит правила вида N:empty. Грамматики этого типа допускают нисходящий грамматический разбор. Общий вид грамматики представлен ниже.
<ОписаниеПонятия>: <ИмяПонятия> <Предок> <Источник> <Состав> <ОписанияСлотов> { <Источник> <Состав> <ОписанияСлотов>
<Предок>: :<ИмяПредка> { {
<Источник>: <ИсточникДанных>=<ОписаниеИсточника> empty
<ОписаниеИсточника>: "<ИмяФайла>"; "<IP-адрес>";
<Состав>: <Состоит> { <ОписаниеСостава>
<ОписаниеСостава>: <ОписаниеПонятия> <ОписаниеКоличества> <ОписаниеСостава> }
<ОписаниеКоличества>: :<ЧислоВхождений>; ;
<ОписанияСлотов>: <ИмяСлота> <ЗначениеСлота> <ОписанияСлотов> }
<ЗначениеСлота>: <Число> <ЕдиницаИзмерения> <Продолжение> [<Число>,<Граница>] <ЕдиницаИзмерения> <Продолжение> "<Строка>" <Продолжение> ~<ОписаниеСтолбца> <ЕдиницаИзмерения> <Продолжение> #<ИмяСлота> <Продолжение> <ОписаниеПонятия> <Продолжение> ?;
<ЕдиницаИзмерения>: (<ИмяЕдиницы>) empty
<Граница>: <Число> > <
<Продолжение>: ; | <ЗначениеСлота>