Реферат: Пошук інформації в Інтернеті
Команди розширеного пошуку дозволяють досить точно описати необхідний документ.
Команди спеціального пошуку не знаходять документи за їх вмістом, а призначені для пошуку Веб-вузлів за їх назвами, фрагментами їх адрес, адресами посилань, які зустрічаються на їхніх Веб-сторінках і т.п.
Важливо, щоб учні зрозуміли, що при пошуку в Інтернеті важливими є дві характеристики: повнота пошуку ( тобто намагання не пропустити деяку важливу інформацію - нічого не загубити) і точність ( тобто відсутність у результатах пошуку зайвої інформації - не знайти нічого зайвого). Як правило, ці характеристики називають спільним словом релевантність, яка і передбачає максимально змістовну відповідність результатів пошуку вказаному запиту. Іншими словами, релевантність - це відповідність відповіді запитанню. Релевантність також можна розглядати і як спосіб впорядкування знайдених за запитом документів: чим більше документ відповідає запиту, тим ближче до початку списку повинна знаходитися його адреса. Для досягнення цього результату пошуковою системою враховуються такі параметри, як кількість знайдених в тексті ключових слів, "контрастність" слова (його відносна частота входження до цього документа), відстань між словами, розташування слова в документі та його підрозділах і т.п.
При цьому слід враховувати, що релевантність - якісна міра. Відповідність відповіді ІПС запитам користувача залежить не лише від властивостей пошукової системи, а й від того, наскільки вдало сформульовано запит, тобто наскільки правильно останній відображає потреби користувача.
Для оптимальної і швидкої роботи з пошуковими системами індексних баз даних існують певні правила написання запитів. Повний перелік таких правил для конкретного пошукового сервера можна знайти на самому сервері в пунктах "Допомога", "Підказка", "Правила створення запиту" тощо. Учнів можна ознайомити з правилами, які частіше використовуються для ІПС "Апорт", "Яндекс" або будь-якої іншої індексної бази даних:
Незалежно від того, яка форма слова стоїть у запиті, пошук ураховує всі словоформи за правилами російської мови. Наприклад, якщо задано запит "идти", то в результаті пошуку будуть знайдені посилання на документи, які містять слова "идет", "шел", "шла" та ін. На запит "окно" буде видана інформація, яка містить і слово "окон", а на запит "отзывали" - документи, які містять слово "отозвали". На жаль, україномовної частини Інтернету цей процес не торкнувся, хоча на пошуковому сервері МЕТА проводяться роботи щодо коректного врахування при запиті особливостей української та російської мов та можливої омонімії мови (серед результатів за запитом російською мовою "лист каштана", крім російського омоніму, отримуються ще й україномовні документи з цим словом у значенні "письмо").
Якщо в запиті слово набрано з великої літери, то всі ІПС будуть враховувати регістр, в якому набрані літери (маленька/велика).
Якщо запит містить одне чи кілька слів, то в результаті пошуку будуть знайдені документи, в яких зустрічаються всі слова запиту, крім обмеженої кількості слів (сполучники, прийменники та ін), які в запиті ігноруються, оскільки не несуть змістовного навантаження). Наприклад, за запитом "яблука на снігу" будуть знайдені всі документи, в яких зустрічаються одночасно два слова. Де саме в межах документа розташовані слова, в якій граматичній формі вони знаходяться - не важливо. Слово "на", яке є прийменником, ігнорується. Тому вказаний запит можна було записати як: "сніг на яблуках" - результат пошуку буде тим самим.
Зірочка наприкінці слова символізує певну кількість будь-якихлітер. Наприклад, за запитом "вер*" будуть знайдені документи, якімістять будь-яке зі слів "по вере, верес, Вера, вересень", у будь-якійграматичній формі.
Лапки вказують пошуковій системі, що задані в запиті слованалежать до ключової фрази, яку слід шукати в тексті повністю. Наприклад, за запитом "експертна система" будуть знайдені всі документи, де трапляється вказане словосполучення або близькі до нього фрази.
При складанні запиту можна комбінувати ключові слова за допомогою логічних операторів (І, АБО, НЕ).
Далі слід розглянути прийоми формування запитів на прикладі конкретної системи. При цьому після введення звичайного простого запиту для пошуку одного слова необхідно ретельно проаналізувати правила роботи з результатами пошуку.
Учні повинні з'ясувати, що після введення з клавіатури запиту на екран виводиться список посилань на документи, які точно відповідають запиту. На такій сторінці користувач може побачити спеціальні позначення і посилання, які полегшують перегляд знайдених сторінок. Слід звернути увагу учнів на такі елементи сторінки з результатами пошуку (мал.5.6 - для спрощення будемо розглядати пошукову систему Яндекс):
Пошукова форма, головним її елементом є рядок запиту, до якого з клавіатури користувач уводить простий або складений запит. При цьому додатково можна уточнити мету пошуку: сторінки, новини, назви товарів чи картинки. Здійснити подальший пошук у результатах попереднього дозволяє параметр "Шукати в знайденому".
Тематичний спектр результатів пошуку. Показуються тільки ті теми каталога, в яких є знайдені документи. Список тем впорядкований за релевантністю. Вказування на посилання призводить до обмеження пошуку сторінками вибраної теми.
Теми більш глибокого рівня, які найкраще відповідають запиту. Вказування на посилання призводить до обмеження пошуку за сторінками вибраної теми.
Регіони пошуку - можна обмежити пошук сайтами вказаного регіону.
Пошук за каталогом - опис ресурсів, що містять слова запиту. Натиснення на посилання призводить до переходу у відповідний розділ каталога (виводиться на екран тільки за умов точної відповідності запиту).
Пошук за ресурсом - опис ресурсів, що містять слова запиту. Натиснення на посилання веде до переходу на ресурс (виводиться тільки за умов точної відповідності запиту).
Результати пошуку у Веб-просторі. Заголовок документа - це посилання на ресурс. За допомогою посилання Показати знайдені слова можна здійснити перехід на "підсвічений" документ, в якому відповідність запиту (слова, які входять до запиту) виділена стрілочками та кольором.
Посилання на інші служби пошукової системи або на інші пошукові системи.
Перелік сторінок, які містять список знайдених за запитом посилань.
Далі доцільно звернутися до однієї з пошукових систем, наприклад, Яндекс, та запропонувати учням увести з клавіатури до пошукової форми простий запит, який складається з одного слова, після чого слід запропонувати учням частково-пошукову роботу стосовно вивчення додаткових посилань, які знаходяться на сторінці, що є результатом пошуку. Робота полягає в тому, щоб шляхом методу випробувань з'ясувати, для чого на сторінках з результатами пошуку за запитом використовуються посилання: "результати пошуку (сторінки, сервери), впорядкування (за релевантністю, за датою), показати знайдені слова, схожі документи, ще з сервера". Для організації такої роботи вчитель може задавати учням додаткові питання, підказувати, на що в кожному конкретному випадку із перерахованих вище слід звертати увагу: порядок відображення сторінок, зміст документів, додаткові символи, які висвітлюються на екрані тощо.
Учні повинні під керівництвом учителя дійти висновків:
Якщо в результаті пошуку було знайдено занадто багато документів, і користувач має бажання скоротити такий список, для цього використовується прапорець "Шукати в знайденому".
При одержанні результатів пошуку за запитом, що складаєтьсяіз кількох слів, користувачеві необхідно звертати увагу на статистикуmрезультатів пошуку, яка відображається праворуч від рядка пошуку,де виводиться статистика слів запиту і знайдених документів.
Статистика слова видається завжди стосовно всієї бази і не залежить від області пошуку. Якщо слово запиту жодного разу не зустрілося в базі, воно виділяється червоним кольором. При цьому користувачеві рекомендується перевірити його правопис.
Статистика документів складається з двох чисел - знайдені документи (сторінки) і сайти (сервери). Якщо вибрати посилання на сторінки, то на екрані послідовно сторінка за сторінкою (по 10 документів на кожній екранній сторінці) відображаються анотації та адреси кожної з них (див. мал.5.6). Якщо вибрати посилання на сервери, то на екрані відображається список, який включає по одному знайденому документу з кожного сервера.
Усі знайдені за запитом документи впорядковуються при відображенні на сторінці з результатами пошуку. За замовчуванням результати пошуку впорядковуються за релевантністю і згруповуються за серверами. Знайдені документи можуть мати позначки "збіг фрази", "строга відповідність" або "нестрога відповідність" ( за ступенем зменшення релевантности або "нестрогі" документи, відокремлені від інших горизонтальною рискою. Діючий порядок упорядкування і групування виділяється жирним шрифтом, альтернатива вказується за допомогою посилання. При групуванні за серверами в кожному знайденому документі відображається посилання "5с/ з сервера" (Ще з сервера) - запит на одержання всіх сторінок цього сервера, які відповідають запитові.