Реферат: Iнструментальнi засоби пошуку iнформацii в Iнтернет

1.1 Пошукові служби

інтернет глобальний пошук інформація

Загальним підходом для всіх служб є пошук за заданим користувачем ключовими словами. Наявність заданих ключових слів перевіряється в тілі документа, його заголовку або посиланнях. У ході пошуку формується Web-сторінка результатів, що містить адреси URL, назви та короткі описи знайдених джерел. Загальна послідовність роботи з усіма службами однакова.

1. Відкрийте початкову сторінку служби.

2. Введіть ключові слова для пошуку та натисніть. Програма повертає Web-сторінку з першою групою знайдених джерел, які відповідають умовам пошуку.

3. Виявивши в списку потрібне джерело, клацніть на посиланні. Броузер відкриє відповідну Web-сторінку.

За способом пошуку та організації результатів всі програми пошуку можна розбити на дві групи. Системи індексування (search index) проводять пошук за заданим користувачем ключовими словами. Укладачі каталогів (search directory) організують Web-сторінки в систему ієрархічно пов'язаних розділів. Способів пошуку в такій системі багато, включаючи переміщення по посиланнях від розділів вищої до розділів нижчих рівнів. І ті, і інші виводять результати, використовуючи базу даних, яку складають, періодично роблячи рейди по мережі.

1.2 Що таке пошукові індекси і каталоги

Індекс використовується для пошуку Web-сторінок за ключовими словами, каталог - по розділах, систематизованим за ієрархічним рубриками.

Агенти мають вбудовані засоби пошуку документів І NetScape Navigator, і Microsoft Internet Explorer мають вбудовані засоби, що дозволяють швидко знаходити потрібні сторінки.

Пошукова система - потужний інструмент, що дозволяє дізнаватися про все на світі: від результатів останніх спортивних матчів до щоденних подій. Завдяки правильно організованому засобу пошуку Web стає невід'ємною частиною повсякденного життя користувача.

PointCast Client - одна з кращих пошукових систем, яка дозволяє отримувати останні новини безпосередньо на робочий стіл комп'ютера. А головне, вона абсолютно безкоштовна!

Можливості потужних систем пошуку виходять далеко за межі простого вміння знаходити Web-сторінки. Багато з них мають вбудовані засоби пошуку адрес електронної пошти, телефонних номерів і повідомлень груп новин. Деякі дозволяють знаходити географічні карти, наприклад, детальні плани міст.


1.3 Індекси

Поява індексу є результатом роботи трьох елементів програми індексування. Власне пошук за ключовими словами виконує Пошукова система (search engine). Саме до цієї частини програми індексування звертається користувач, задаючи умова пошуку в рядку для ключових слів. Пошук проходить в організованій програмою базі даних. Сукупність знайдених посилань і адрес URL оформляється у вигляді Web-сторінки результатів. Системи різняться своїми можливостями. Деякі з них підтримують використання ключових виразах булевих операторів, дозволяючи істотно звузити область пошуку. Інші, навпаки, збирають усе, що містить принаймні одне із заданих ключових слів.

"Павук" (spider) (іноді називають "хробаком" (worm) або "гусеницею" (crawler)) повинен виявити як можна більше Web-сторінок. Для цього він "запам'ятовує" всі посилання на відкриті їм документи. У виявлених таким чином нових сторінках знову відшукуються і запам'ятовуються посилання. Ця процедура повторюється до тих пір, поки не будуть вичерпані всі джерела посилань. Однак очевидно, що подібний метод не може гарантувати всеосяжних результатів: чи потрапить той чи інший джерело в число зібраний "павуком" сторінок, цілком залежить від наявності посилань на нього в інших документах Web.

Кожного разу, коли "павук" знаходить чергову Web-сторінку, упорядник індексу (indexer) вивчає вміст, заносячи слова, знайдені в посиланнях і тексті сторінок, в гігантську базу даних, ущільнити базу і очистити її від повторюваних елементів можна за допомогою високоефективних алгоритмів будови баз даних, закладених в упорядник індексу. Це нескладно, адже в людської мови поки що не використовуються унікальні слова. Укладач індексу має в результаті створити базу, в якій URL адреси були б співвіднесені з наборами зустрічаються у них слів.

Якщо яку-небудь Web-сторінку не вдається знайти, це ще не означає, що такої сторінки не існує. Багато пошукових систем генерують списки, в яких споріднені теми зібрані у розділи, організовані за принципом каталогів (такий принцип закладено, наприклад, в Yahoo!). Якщо вам не вдається знайти потрібні матеріали - скажімо, про догляд за йоркширським тер'єром (grooming Yorkshire Terrier), спробуйте відшукати їх за індексом. Цілком можливо, шукана тема виявиться серед його посилань.

Щоб підвищити ефективність пошуку за індексом, зробіть умова пошуку більш загальним і додайте ключове слово "index". Так, умова Grooming AND (Yorkie OR "Yorkshire Terrier") слід змінити на Index AND (Yorkie OR Yorkshire). He виключено, що менш конкретна умова Index AND Terrier дасть ще кращі результати. Якщо умова вибране вдало, пошукова система поверне один або кілька індексів, що посилаються на сторінки про йоркширської породі і тер'єрів.

1.4 Укладачі каталогів

На перший погляд відрізнити програми індексування від укладачів каталогів важко. Матерія для пошуку для обох інструментів служить вміст Web-сторінок. Однак, на відміну від програм індексування, укладачі каталогів не розшукують усі Web - сторінки Internet. Об'єктом пошуку для них є адреси URL, які включаються до систематизований каталог. Пошук по каталогу можна проводити як за допомогою броузера, так і вручну, клацаючи на назвах розділів і знайомлячись з їх вмістом.

Тим не менш, незважаючи на принципові відмінності у механізмах роботи, грань між грамами індексування та складання каталогів поступово стирається. Все частіше можна зустріти індекс, забезпечений засобами побудови каталогу. Нерідко самі Web-сторінки у верхній частині мають якусь подобу змісту з посиланнями на окремі розділи.


2 . ПОПУЛЯРНІ ПОШУКОВІ СЛУЖБИ

Правильний вибір інструменту пошуку - ключовий момент пошукової стратегії. Якщо не допомагає одна служба, можна спробувати інші

Параметри браузера можна змінити так, щоб деяка Web-сторінка відображалася щоразу, коли відбувається запуск Internet (стала початковою сторінкою за замовчуванням). Зробивши початкової Web-сторінку будь-якої пошукової служби, ви отримаєте негайний доступ до всього набору засобів пошуку, якими володіє дана служба. Excite, InfoSeek і Yahoo! є для цього кращими кандидатами.

2.1 Тематичні каталоги

Найбільш популярним у всьому світі визнано тематичний каталог Yahoo! (http://www.yahoo.com/). Він являє собою величезну базу даних URL-адрес сайтів самої різної тематики. Yahoo! пропонує вам скористатися ієрархічним деревом при пошуку інформації. Тобто ви обираєте спочатку загальну тематику, що задовольняє вашому запиту інформації, і далі конкретизуєте, слідуючи підказкам каталогу. У звісно результаті ви отримуєте список сайтів, що містять інформацію, відповідну вашому запиту. На Yahoo! ви також можете піти й іншим шляхом. Проаналізуйте передбачуване зміст запитуваної інформації та виберіть ключові слова, які обов'язково зустрінуться в цікавлять вас матеріалах або їх заголовках. Набираєте ці слова через пробіл в рядку введення на головній сторінці Yahoo! і натискаєте Enter. Система спробує сама підібрати цікаву для вас інформацію. Так як Yahoo! система англомовна, то досить зручно використовувати Інтернет-перекладач, такий як "Сократ Інтернет" (http://www.arsenal.ru/).

Якщо ж ви шукайте інформацію завідомо російськомовну, то має сенс використовувати російські каталоги. Принцип роботи з ними ідентичний, тому що ми розглянули на прикладі з Yahoo!. Тут варто відзначити перший російський каталог Russia on the Net (http://www.ru/), один з найбільших російськомовних каталогів List.RU (http://www.list.ru/), російський варіант Yahoo! (http:/ / www.yahoo.ru/). Має місце, також, каталог "Сузір'я Інтернет", який містить лише обрані (заявлено як найцікавіші) ресурси. Говорячи про бази даних, не можна не згадати чудовий російський проект "Жовті сторінки Інтернет" (http://www.piter-press.ru/yp), де як і в однойменній книзі представлена детальна інформація про самих різних ресурсах Інтернет. У бізнесі також знадобляться каталоги підприємств і каталоги товарів і послуг. Мабуть, самий великий каталог підприємств СНД Партнер (http://trifle.net/cis).

2.2 Роботи індексів або пошукові машини

К-во Просмотров: 156
Бесплатно скачать Реферат: Iнструментальнi засоби пошуку iнформацii в Iнтернет