Реферат: Поисковые машины интернета
Расширенный поиск. Яндекс позволяет решать сложные поисковые задачи, не пользуясь языком запросов. Для этого воспользуйтесь формой расширенного поиска, где сложные поисковые условия задаются в простой и наглядной форме.
Обратите внимание, что при заполнении нескольких полей Яндекс учтет все заданные вами условия одновременно. Например, указав язык документа как «русский» и введя в поле находятся на сайте адрес какого-либо сайта, вы в результате поиска получите список документов с заданного сайта, написанных на русском языке.
Сложный поиск. Главный недостаток простого поиска - большое количество выдаваемых ссылок.
Для увеличения эффективности (полноты и точности) поиска необходимо использовать сложный поиск с применением логических операторов языка.
При сложном поиске кроме ключевых слов в запрос включаются логические операторы данной поисковой системы. К сожалению общепринятого стандарта логических операторов пока не существует. Ниже приводятся примеры использования основных логических операторов.
Для упрощения задачи формирования сложных запросов используют специальные формы.
Таблица 1.1
Синтаксис | Что означает оператор | Пример запроса |
пробел, & | Логическое И (в пределах предложения) | автомобили легковые - поиск документов, содержащих оба слова запроса в одном предложении |
| | Логическое ИЛИ | фото | фотография | снимок | фотоизображение - поиск документов, содержащих хотя бы одно из слов запроса |
+ | Обязательное наличие слова в найденном документе (работает также в применении к стоп-словам) | легковые автомибили +ГАЗ - поиск документов с обязательным присутствием слова 'ГАЗ' |
~ | Бинарный оператор И НЕ (в пределах предложения) | легковые автомибили ~импортные - поиск информации по отечественным легковым автомобилям |
() | Группирование слов | (технология | изготовление) (сыра | творога) - поиск информации по технологии изготовления сыра и творога |
"..." | Поиск фразы | "война и мир" - поиск документов, содержащих данную фразу |
Поиск в зонах. Можно искать информацию в «зонах» — заголовках (имя «зоны»: Title), ссылках (имя «зоны»: Anchor) и адресе (имя «зоны»: Address).
Синтаксис: $имя_зоны (поисковое выражение).
Запрос '$title CompTek ' ищет в заголовках документов слово 'CompTek '.Запрос '$anchor (CompTek | Dialogic)' находит документы, в cсылках внутри которых есть одно из слов 'CompTek ' или 'Dialogic '. |
Поиск в определенных элементах. Можно ограничить поиск информации списком серверов или наоборот исключить сервера из поиска (url). Можно также искать документы, содержащие ссылки на определенные URL (link), и файлы картинок (image). Если вы хотите работать не с конкретным URL (image), а со всеми, начинающимися с данной последовательности символов, используйте «*».
Синтаксис: #имя_элемента="имя_файла (URL)".
По запросу 'CompTek ~~ #url="www.comptek.ru*" ' будут искаться упоминания компании 'CompTek ' везде, кроме ее собственного сервера (www.comptek.ru). А запрос '#link="www.comptek.ru*" ' покажет все документы, которые сослались на сервер компании.Запрос ' #image="tort*"' даст ссылки на документы с изображениями тортов (хотя, возможно, найдется и портрет черепахи Тортиллы). |
1.2 Язык поисковых запросов
Язык поисковых запросов — набор метасимволов и правил, в соответствии с которыми строится запрос к поисковой системе. В различных поисковых системах язык может различаться, однако обычно он является некоторым подобием языка регулярных выражений с дополнениями, связанными со спецификой работы той или иной поисковой системы. Знание и правильное применение языка запросов конкретной поисковой машины улучшает и упрощает пользователю процесс поиска информации.
Отличительная особенность Яндекса — возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов[19] . Так, например, для операции исключения можно указать область действия: запрос A ~~ B найдет документы (страницы), в которых присутствует А, но не присутствует В, а запрос А ~ Б -документы, где слово Б не присутствует со словом А в одном предложении. Аналогично, оператор & ищет сочетания ключевых слов в предложении, а && — во всём документе. Оператор ! позволяет отключить морфологию для конкретного слова, а !! позволяет указать нормальную форму, что позволяет обойти некоторые проблемы связанные с омонимией. Например запрос !!Иванов будет находить Иванова и Ивановых, но не Ивана.
1.3 Поиск информации в зонах (элементах)
Поиск в зонах. Можно искать информацию в "зонах": заголовках (имя "зоны": Title), ссылках (имя "зоны": Anchor) и адресе (имя "зоны": Address).
Пример:
Запрос '$title обращения граждан' ищет в заголовках документов слово 'обращения граждан' .
Запрос '$anchor (sf | gov)' находит документы, в cсылках внутри которых есть одно из слов 'sf' или 'gov' .
Поиск в определенных элементах. Поиск информации может быть ограничен списком серверов и исключать сервера из поиска (url). Можно также искать документы, содержащие ссылки на определенные URL (link), и файлы картинок (image). Для работы не с конкретным URL (image), а со всеми, начинающимися с данной последовательности символов, используется "*".
Пример:
По запросу 'Федеральное Собрание ~~ #url="www.president.ru"' будут искаться упоминания о Федеральном Собрании везде, кроме официального сайта Президента РФ (www.president.ru).
Запрос '#link="www.president.ru"' покажет все документы, которые сослались на сайт Президента РФ.
Возможен также поиск по ключевым словам (keywords), аннотациям (abstract) и подписям под изображениями (hint).
Пример:
По запросу '#keywords=(поисковая система) | #abstract=(поисковая система)' будут искаться все страницы, в meta тегах которых есть эти слова.
По запросу '#hint=(Путин) ' будут найдены документы, содержащие изображение с такой подписью.
1.4 Порядок регистрации сайта в каталоге
Для регистрации сайта в каталоге нужно зайти на сайт http://www.autoreg.su/
Рисунок 4.1
--> ЧИТАТЬ ПОЛНОСТЬЮ <--