Реферат: Семантические основы социальной информатики
Тема 2
Семантические основы социальной информатики
Информология- общая теория информации. Часто понятие "информация" используют, не задумываясь о глубине его содержания, отождествляя понятия знание, данные, информация. Очевидно, что "обиходное" употребление термина "информация" совершенно неуместно, когда речь идет о теории или теориях информации. Нередко в этих теоретических построениях термин "информация" наполнен разным смыслом, а следовательно, сами теории высвечивают лишь часть граней некоторой системы знаний, которую можно назвать общей теорией информации или "информологией" - наукой о процессах и задачах передачи, распределения, обработки и преобразования информации.
Возникновение информологии как науки можно отнести к концу 50-х годов нашего столетия, когда американским инженером Р. Хартли была сделана попытка ввести количественную меру информации, передаваемой по каналам связи. Рассмотрим простую игровую ситуацию. До получения сообщения о результате подбрасывания монеты человек находится в состоянии неопределенности относительно исхода очередного броска. Сообщение партнера дает информацию, снимающее эту неопределенность. Заметим, что число возможных исходов в описанной ситуации равно 2, они равноправны (равновероятны) и каждый раз передаваемая информация полностью снимала возникавшую неопределенность. Хартли принял "количество информации", передаваемое по каналу связи относительно двух равноправных исходов и снимающее неопределенность путем оказания на один из них, за единицу информации, получившую название "бит".
Создатель статистической теории информации К. Шеннон обобщил результат Хартли и его предшественников. Его труды явились ответом на бурное развитие в середине века средств связи: радио, телефона, телеграфа, телевидения. Теория информации Шеннона позволяла ставить и решать задачи об оптимальном кодировании передаваемых сигналов с целью повышения пропускной способности каналов связи, подсказывала пути борьбы с помехами на линиях и т.д.
В работах Хартли и Шеннона информация возникает перед нами лишь в своей внешней оболочке, которая представлена отношениями сигналов, знаков, сообщений друг к другу - синтаксическими отношениями. Количественная мера Хартли-Шеннона не претендует на оценку содержательной (семантической) или ценностной, полезной (прагматической) сторон передаваемого сообщения.
Новый этап теоретического расширения понятия информации связан с кибернетикой - наукой об управлении и связи в живых организмах, обществе и машинах. Оставаясь на позициях шенноновского подхода, кибернетика формулирует принцип единства информации и управления, который особенно важен для анализа сути процессов, протекающих в самоуправляющихся, самоорганизующихся биологических и социальных системах. Развитая в работах Н. Винера концепция предполагает, что процесс управления в упомянутых системах является процессом переработки (преобразования) некоторым центральным устройством информации, получаемой от источников первичной информации (сенсорных рецепторов) и передачи ее в те участки системы, где она воспринимается ее элементами как приказ для выполнения того или иного действия. По совершении самого действия сенсорные рецепторы готовы к передаче информации об изменившейся ситуации для выполнения нового цикла управления. Так организуется циклический алгоритм (последовательность действий) управления и циркуляции информации в системе. При этом важно, что главную роль играет здесь содержание информации, передаваемой рецепторами и центральным устройством. Информация, по Винеру - это "обозначение содержания, полученного из внешнего мира в процессе нашего приспособления к нему и приспособления к нему наших чувств" .
Таким образом, кибернетическая концепция подводит к необходимости оценить информацию как некоторое знание, имеющее одну ценностную меру по отношению к внешнему миру (семантический аспект) и другую по отношению к получателю, накопленному им знанию, познавательным целям и задачам (прагматический аспект).
Попытки построить модели понятия информации, охватывающие семантический аспект знания, содержащегося в некотором высказывании относительно обозначаемого объекта, привели к созданию ряда так называемых логико-семантических теорий (Р. Карнап, И. Бар-Хиллел, Дж. Г. Кемени, Е.К. Войшвилло и др.). В них информация рассматривается как уменьшение или устранение неопределенности. Естественно предположить, что средствами какого-либо языка с помощью создаваемых в нем высказываний можно описать некоторую совокупность возможных ситуаций, состояний, альтернатив. Семантическая информация, содержащаяся в каком-либо высказывании, исключает некоторые альтернативы. Чем больше альтернатив исключает высказывание, тем большую семантическую информацию оно несет. Так, например, одна из возможных совокупностей ситуаций может быть описана следующим образом: "все тела при нагревании расширяются". Высказывание "металлы при нагревании расширяются" исключает все альтернативы в которых речь может идти о неметаллах. Семантическая сила высказывания может быть оценена отношением все тела(все металлы). Еще более информативным будет высказывание "железо при нагревании расширяется", так как оно исключает все альтернативы, кроме одной.
При всем многообразии логико-семантических теорий им присущи общие черты, они указывают путь решения трех связанных друг с другом проблем: определения совокупности возможных альтернатив средствами выбранного языка, количественной оценки альтернатив, их относительного сопоставления (взвешивания), введения меры семантической информации.
В рассмотренных теоретических конструкциях - статистической и семантической информации - речь шла о потенциальной возможности извлечь из передаваемого сообщения какие-либо сведения. Вместе с тем в процессах информационного обмена очень часто складываются ситуации, в которых мощность или качество информации, воспринимаемое приемником, зависит от того, насколько он подготовлен к ее восприятию.
Понятие тезауруса является фундаментальным в теоретической модели семантической теории информации, предложенной Ю.А. Шрейдером и учитывающей в явной форме роль приемника. Согласно этой модели, тезаурус - это знания приемника информации о внешнем мире, его способность воспринимать те или иные сообщения. Представим себе, что до получения телеграммы "Встречай завтра рейс СУ172" мы из вчерашнего разговора по междугороднему телефону уже знали о предстоящем приезде своего родственника или друга, а наведя справки, узнали и номер авиарейса, с которым он может прибыть в город. Наш тезаурус уже содержал информацию, заключенную в телеграмме. Следовательно он не изменился с ее получением и семантическая ценность этой информации оказалась нулевой.
Очевидно, что к подобной оценке семантического содержания информации примешивается семантический аспект, скрытый в изначальной "установке" тезауруса на осмысление принимаемого сообщения.
В прагматических концепциях информации этот аспект является центральным, что приводит к необходимости учитывать ценность, полезность, эффективность, экономичность информации, т.е. те ее качества, которые определяющим образом влияют на поведение самоорганизующихся, самоуправляющихся, целенаправленных кибернетических систем (биологических, социальных, человеко-машинных).
Одним из ярких представителей прагматических теорий информации является поведенческая модель коммуникации - бихевиористская модель Акоффа-Майлса. Исходным в этой модели является целевая устремленность получателя информации на решение конкретной проблемы. Получатель находится в "целеустремленном состоянии", если он стремится к чему-нибудь и имеет альтернативные пути неодинаковой эффективности для достижения цели. Сообщение, переданное получателю иформативно, если оно изменяет его "целеустремленное состояние".
Так как "целеустремленное состояние" характеризуется последовательностью возможных действий (альтернатив), эффективностью действия и значимостью результата, то передаваемое получателю сообщение может оказывать воздействие на все три компонента в различной степени. В соответствии с этим передаваемая информация различается по типам на "информирующую", "инструктирующую" и "мотивирующую". Таким образом, для получателя прагматическая ценность сообщения состоит в том, что оно позволяет ему наметить стратегию поведения при достижении цели построением ответов на вопросы: что, как и почему делать на каждом очередном шаге? Для каждого типа информации бихевиористская модель предлагает
свою меру, а общая прагматическая ценность информации определяется как функция разности этих количеств в "целеустремленном состоянии" до и после его изменения на новое "целеустремленное состояние".
Следующим этапом в развитии прагматических теорий информации явились работы американского логика Д. Харраха, построившего логико-прагматическую модель коммуникации. Одной из слабостей бихевиористской модели является ее неподготовленность к оценке ложных сообщений. Модель Харраха предполагает учет общественного характера человеческой коммуникации. В соответствии с ней получаемые сообщения должны быть сначала подвергнуты обработке, после которой выделяются сообщения "годные к употреблению". Именно с совокупности годных к употреблению сообщений должны быть применены критерии прагматической ценности.
Теория информации "в смысле Шеннона" возникла как средство решения конкретных прикладных задач в области передачи сигналов по каналам связи. Поэтому, по-существу, она являлась и является прикладной информационной наукой. Семейство таких наук, специально изучающих информационные процессы в том или ином их специфическом содержании и форме, во второй половине нашего века растет довольно быстро. Это - кибернетика, теория систем, документалистика, лингвистика, символическая логика и др. Стержнем, объединяющим все эти исследования, служит общая теория информации -"информология", в основу которой и положены синтаксические, семантические и прагматические концепции информации.
Формализация знаний: методы и приемы. Их эффективность, сравнительный анализ[1]. При поиске наиболее удобных, рациональных средств и форм информационного обмена человек чаще всего сталкивается с проблемой компактного и однозначного представления знаний.
Представление знаний это процесс, конечная цель которого поместить некоторый объем знаний в своеобразную " упаковку" в которой он может начать движение по каналам информационного обмена, дойти до получателя, или задержаться в пунктах хранения знаний. Такой упаковкой может быть фраза устной речи, письмо, книга, справочник, географическая карта, кроссворд, картина и т.п.
Каждый вид упаковки имеет свои особенности, но всем им присуще одно качество, хотя и не в одинаковой степени: упаковка призвана обеспечить сохранность вложенного знания. Причем не только и не столько физическую, сколько смысловую (семантическую). Для этого необходимо, чтобы отправитель и получатель информации упакованных знаний пользовались некоторой общей системой правил для их представления и восприятия. Назовем такую систему правил формализмом представления знаний.
Самым естественным, подходящим для человека формализмом является язык ( устная речь и письменность). Без знаний, без постоянной работы по их упаковке в языковые конструкции язык мертв. Он живет и развивается благодаря творческой энергии человека, благодаря тому, что человеческая мысль постоянно и настойчиво ищет выхода в выраженную в языке форму. Всякую ли мысль или знание можно выразить в языковой форме? По-видимому, нет. Например, существуют десятки различных определений понятий здоровье, интеллект, мышление, информация и т.п. Отмечая эту ограниченность выразительных средств языка, Ф. Энгельс писал:" Дефиниции не имеют значения для науки, потому что они всегда оказываются недостаточными". Мысль, которую нельзя выразить в языковой конструкции, не может быть включена в информационный обмен. Общение людей, таким образом, осуществляется с помощью языка как формы представления знаний. Одному и тому же содержательному
знанию можно придать различную словесную или текстовую форму. Это очень сильно проявляется, например, в художественной прозе, поэзии и т.д. Богатство языка это и богатство культуры того или иного народа.
Вместе с тем, в некоторых областях деятельности людей это богатство и разнообразие выразительных средств естественного языка становится скорее недостатком, чем достоинством. Например, слова команды должны быть короткими, резкими, иметь однозначный смысл, иначе не получится согласованных и четких совместных действий подчиненных. В специальных отраслях науки формируются специфические языковые системы, являющиеся как бы " сужением " естественного языка. Особо выделяется язык математики, как некоторая основа изложения системы знаний в точных, естественных науках. Свой язык имеют химия, физика, философия и т.д.
Целесообразность применения таких суженных языковых систем (диалектов), позволяет повысить надежность процессов информационного обмена, т.к. возможность неправильного истолкования передаваемой информации снижается. При этом , конечно, сужается и круг получателей, поскольку для восприятия информации необходимо владеть соответствующим диалектом. Главные достоинства суженного языка - возможность создавать и использовать типовые, "стандартные " упаковки знаний, а также в значительной мере снять полисемию ( смысловую многозначность), присутс
твующую в естественном языке.
Полисемия - враг информационного обмена, фактор внесения искажения и ошибок ( семантического шума) на пути передачи информации. Поэтому устранение многозначности является одним из наиболее важных направлений в разработке формальных приемов представления знаний. Создание языка науки или языка деловой прозы, называемого часто " концеляритом " , является естественным шагом на этом пути, огромной работой общества на протяжении ряда столетий. Сопоставление этой подсистемы естественного языка с литературным языком показывает насколько они различны по характеристикам, определяющим их выразительную способность.
Так "канцелярит" предназначен для объективизации изложения информации, использует, как правило, переводимые категории и языковые формы, лишен синонимии, оперирует конкретными фактами и понятиями, информативен (в противоположность информационной избыточности), ему присуща логичность, он по характеру алгебраичен (мысль, информация, знание развернуты в последовательность слов и предложений, постепенно формируясь в полном, законченном виде к завершению текста). Все эти свойства не являются обязательными для языка литературы, которому свойственна субъективность форм, возможность применения непереводимых конструкций, бесконечно богатая синонимия, образность (геометричность) высказываний и т.д.
--> ЧИТАТЬ ПОЛНОСТЬЮ <--