Реферат: Лінгвістичне забезпечення інтелектуальних систем
3. Гіпертекст як форма організації інформації
У літературі термін “гіпертекст” (ГТ) використовується найчастіше як для позначення об'єкта дослідження, так і технології дослідження. Як об'єкт ГТ являє собою сітку, в якій зв'язки між вузлами - фрагментами ГТ - проставлені самим користувачем, частіше усього по семантичній близькості фрагментів. У якості фрагментів можуть виступати тексти, формули, графічна інформація, звуко- і відеозапис, тобто довільні модулі знань. У ГТ знято всі обмеження на структуру і зв'язки між ними. Не потрібно формалізації знань. На відміну від СУБД і інформаційно-пошукових систем елементами ГТ є природні тексти, що не потребують ні індексування, ні форматування. Кожний модуль знань може бути поданий у своїй формі. Доступ до них здійснюється шляхом навігації в гіпертекстовій базі знань. Гіпертекст відкритий для поповнення і змін. У нього немає апріорно визначеної структури. Це засіб представлення заздалегідь не структурованих, вільно нарощуваних знань. Користувач власноруч формує своє інформаційне середовище. Для цього ГТ - технологія надає йому дружній інтерфейс. Завдяки такому підходу зникають багато бар'єрів між користувачем і комп'ютером або відповідною інформаційною системою. Вона перестає бути “чорним ящиком”; взаємозв'язок між елементами знань стає видимим і доступним для користувача, що може настроювати інформаційну систему на свою проблемну область.
Все це знаменує новий рівень взаємовідносин людина - система і є відповідним до інтелектуальної діяльності людини.
Серед різноманітних визначень гіпертексту найстислішим і доречнішим є таке: “Гіпертекстом називається текст, на якому задані зв'язки між виділеними в ньому елементами”.
Елементами ГТ можуть бути довільні символи (наприклад, знаки алгебраїчних операцій), слова і словосполучення, повні тексти й окремі фрази, малюнки, графіки, або їх частини тощо. Якщо до складу ГТ входить інформація різних типів (текст, ілюстрація, мультиплікація, звук, відео), то такий ГТ називають гіпермедіа (ГМ) або гіперсередовищем.
Серед різноманітних моделей ГТ (наприклад, апарат теорії графів) найпростішою і наочною є сітка, у вузлах якої записуються блоки інформації, а дуги інтерпретуються як зв'язки між блоками і виділеними в них елементами. Зв'язки можуть бути одно - і двобічними.
Ці зв'язки грають особливу роль у гіпертексті. Належність до них є однією з основних відмінностей гіпертекстових баз даних від звичайних. У звичайних БД зв'язки носять чисто службовий характер - організуються для забезпечення доступу до даних шляхом опрацювання запитів. У ГТ системах зв'язки самі по собі надають важливу для користувача спеціально збережену і видавану інформацію. У залежності від моделі зв'язки в гіпертексті виділяються різноманітними графічними засобами: шрифтами, кольором, спеціальними символами.
Зв'язки можуть інтерпретуватися як причина і наслідок, загальне і часткове, функція й аргумент, а також, що дуже важливо, у якості зв'язку може існувати будь-яка інша асоціація, яку бачить, встановлює й називає користувач. Зв'язок є одним із головних об'єктів аналізу, проектування і використання. Це стало основою для висновку, що “гіпертекстові системи свідчать, вочевидь, про початок нового періоду - періоду “зв’язоцентричного” підходу”. Тут мається на увазі, що на початку (перші двадцять років інформатики) панував “алгоцентричний” підхід - у центрі уваги знаходилися алгоритми і мови програмування. Потім у 70-ті роки була епоха “інфоцентричного” підходу - інтерес до баз даних і систем керування цими базами. Поряд із “зв’язоцентричним” можна говорити також про “антропоцентричний” підхід, оскільки основною метою гіпертексту є створення дружнього інформаційного середовища для інтелектуальної роботи користувача.
1. Можливості ГТ як засобу представлення інформації дозволяють (на основі аналізу проекту QVARTET Технічного університету Лафборо, Великобританія): комбінувати структуру вихідного документа, забезпечувати їх гнучкість; автоматизувати навчання: не тільки переглядати групу документів, але і вивчати механізм утворення асоціативних зв'язків;
2. здійснювати навігацію у великих базах даних, незалежно від їхнього обсягу, забезпечуючи доступ до необхідної інформації, пропонувати пошукову стратегію, побудовану з врахуванням інтересів конкретного користувача;
3. застосовувати будь-які типи дискретних носіїв для забезпечення багатосередовищності (тексту, звуку, відео, графіки).
Крім того, ГТ є засобом підтримки неформалізованої інтелектуальної діяльності, тому що вказує на зв'язки кожного окремого аспекту або поняття, чим забезпечується більш легкий доступ до інформаційних об'єктів; не потребує формалізації знань; має практично необмежену область застосування, може бути інструментом аналізу і прогнозування структур досліджуваних об'єктів; організує інформацію з чисто семантичних критеріїв, завдяки чому виникає ефект об'єктивного інформаційного середовища.
4. Гіпертекстова технологія
Як було зазначено вище, концепція гіпертексту з’явилася ще в некомп’ютерну епоху.
Дійсно, текстовий матеріал можна представити з використанням значеннєвих зв'язків і без комп'ютерів. Прикладом є довідники й енциклопедії з добре розвиненою системою посилань між текстовими фрагментами. Ці фрагменти можна вважати за вузли сітки. Проте структура таких “ручних” систем ГТ практично не дозволяє читачеві достатньо глибоко аналізувати матеріал через трудомісткість доступу до різних вузлів сітки.
Під ГТ-технологією розуміється формування, підтримка, нарощування і перегляд організованого у виді сітки тексту на комп'ютерній основі.
Комп'ютерна ГТ-технологія забезпечує легкість роботи з гіперсіткою або гіпертекстом як об'єктом. З погляду комп'ютерної технології упорядкування або формування ГТ, тобто накопичення інформації в базі даних, може мислитися як наступне покоління текстового редактора. На додаток до звичних характеристик ГТ-редактор повинен мати засоби: зміни початкової структури тексту; введення підрядкових зауважень, що не впливають на головний текст; електронні закладинки тощо.
Перегляд або читання гіпертексту - це звертання до гіпертекстової бази через інтерфейс користувача, тобто фактично нове покоління систем керування текстовими БД. Повний текст стає доступним у множині проекцій для різних цілей і при різноманітних стратегіях пошуку. У ГТ системах база даних організується у вигляді відкритої, вільно нарощуваної і змінюваної сітки, вузли якої (лінійні тексти) з'єднуються самим користувачем із уже наявними в базі даних вузлами. Пошук інформації в мережі здійснюється шляхом інтерактивної навігації по зв'язках, де перехід від одних елементів до інших виконується з урахуванням їхньої семантичної близькості, текст одержує як би ще один вимір. Такий підхід якісно відрізняє ГТ технологію від традиційних засобів звернення до інформації через пошуковий образ.
Одним із важливих методів освоєння інформації є запам'ятовування різноманітних шляхів переміщення в ГТ-мережі. Виявлення шляхів або віртуальних структур можна розглядати як альтернативу опрацюванню інформації за правилами логічного виводу.
Програмне забезпечення, що підтримує ГТ-технологію, ґрунтується на чотирьох базисних функціях, властивих тільки ГТ: ЗАМІЩЕННЯ, ПРИМІТКИ, ЗАПИТИ і ПОСИЛАННЯ.
Використання функції ЗАМІЩЕННЯ при скануванні тексту дозволяє замінити будь-який вузол пов'язаної з ним інформації текстовим фрагментом, малюнком тощо. Наприклад, замість заголовка розділу можна одержати його текст або анотацію до нього.
Функція ПРИМІТКИ дає можливість робити “примітки на полях” у всьому різноманітті виразних засобів сучасних терміналів (кольорової графіки, музики). Ця функція є оберненою до попередньої: із виділеним вузлом потрібно зв'язати зазначену інформацію.
Функція ЗАПИТИ дозволяє аналізувати текст із певної точки зору. При цьому може використовуватися довільна інформація, що пов'язана з вузлом. Пошук може здійснюватися по ключових словах, роздільникам, шляхом зіставлення зі зразком тощо, тобто необхідні знання фільтруються з гіпертексту. У сполученні з функцією ЗАМІЩЕННЯ функція ЗАПИТИ одержує функціонально-орієнтовані зрізи вихідного тексту, тобто структурує текст відповідно до потреб користувачів.
Функція ПОСИЛАННЯ є найбільше важливою функцією гіпертексту. Вона використовує зв'язки інформаційної сітки, у вигляді якої ГТ поданий як об'єкт. Завдяки цим зв'язкам функція звертається до асоціативно зв'язаних фрагментів даного вузла. Фізично це означає цілеспрямований перегляд тексту, причому в різноманітних напрямках і на різну глибину. Напрямок можна вказувати за допомогою миші в діалоговому режимі, або автоматично за допомогою запитів, що фільтрують інформацію.
На сучасному рівні розуміння гіпертекст являє собою середовище програмного забезпечення для організації спільної роботи, комунікації і придбання знань. ГТ підтримує властивість мозку берегти і відшукувати інформацію за допомогою асоціативних зв'язків. Організація інформації в гіпертексті по чисто семантичних критеріях робить його новим інструментом для підтримки інтелектуальної діяльності людини. До такої діяльності можна віднести:
· попереднє обґрунтування ухвалення рішення;
· пошук рішення складної (погано формалізованої) проблеми;
· проектування різноманітного роду об'єктів;
· розробку деякої системи ідей;