Реферат: Методы поиска и анализа информации

А, если Вы используете для поиска каталог, то требуется понять, в каких разделах может находиться интересующая Вас информация:

Предприятия ---> Пищевая промышленность;

Товары/ услуги ---> торговля ---> Промышленные товары;

Товары/ услуги/ ---> торговля ---> Химия ---> хозяйственно-бытовые товары;

Промышленность и сельское хозяйство ---> Производство ---> промышленность;

Производство и поставки ---> Машиностроение ---> Коммунальное машиностроение;

Производство и поставки ---> Машиностроение

и т.д.

Теперь давайте подробнее рассмотрим этапы поиска информации, описанные в предыдущем разделе.

Определитесь с предметом поиска. Основное правило поиска - определитесь, что именно Вас интересует, и что Вы хотите найти? Ведь если Вы хорошо знаете, предмет поиска, то искать намного легче.

Постарайтесь, как можно более подробно конкретизировать, что же Вы будете искать.

Например, Вы хотите найти информацию о фильтрах для очистки воды. Какие именно фильтры Вас интересуют? Бытовые, промышленные, настольные, напольные, карманные? Какую технологию очистки Вы предпочитаете? Можно конечно собрать информацию обо всех существующих типах фильтров, но если Вы будете искать что-то конкретное, то потратите значительно меньше времени и получите более качественный результат.

Итак, как выглядят правильное и неправильное описание предмета поиска?

Неправильное: Найти производителей фильтров.

Здесь задача поставлена слишком широко, при поиске непременно возникнут вопросы по дальнейшей конкретизации необходимой Вам информации. Что нужно найти: информацию о всех производителях, либо адреса производителей конкретных типов фильтров, либо координаты производителей в определенной стране или регионе. Какая информация требуется: только координаты, информация о производимой продукции и расценках и т.д.

Правильное: Найти производителей промышленных фильтров для воды. Фильтры предполагается использовать для пищевого производства. Требуемые технологические характеристики: производительность- Х л/час, габариты - не более 5х5 м, способ очистки - керамические фильтры, степень очистки - все микробы умерли. Регион: Россия. Требуемая информация: адреса, контактные телефоны, E-mail, прайс-листы.

Если же Вы ничего не знаете о предмете поиска кроме общей темы, то начать придется с поиска информации о самом предмете поиска. Задача переходит в другую плоскость - "найти хоть что-нибудь". Можете попробовать найти интересующую Вас тему в каталоге ссылок, кроме того, источниками информации могут быть специальные справочники или энциклопедии общего профиля, где можно почерпнуть начальные сведения. Если Вас постигла неудача - воспользуйтесь поисковой машиной. Правда в этом случае Вас ждет "море информации" и Вы потратите значительное время, чтобы его "переплыть".

Подбор ключевых слов. Найдете ли Вы нужную Вам информацию, во многом зависит от правильного подбора ключевых слов. Поэтому очень важно научиться подбирать ключевые слова и их комбинации.

На основе предварительно полученной информации о предмете поиска составьте максимально широкий набор ключевых слов в виде отдельных терминов, словосочетаний, названий и фамилий, тесно связанных с проблемой, профессиональной лексики.

Естественный язык запросов привлекает своей простотой, однако, как показывает практика, он менее эффективен при серьезном поиске, когда ставится задача найти все или большинство документов на заданную тему.

Рассмотрим основные моменты, которые помогут вам правильно сформулировать запрос к поисковой машине:

Не задавайте только одно слово. Используйте целые фразы, или, по крайней мере, несколько слов;

Указывайте слова, которые не должны встречаться в искомых документах. Обычно для этого используют либо знак "-", либо ключевое слово NOT;

Начинайте имена собственные: названия компаний, городов, фамилии людей, и др. с заглавных букв, а все остальные слова пишите только маленькими буквами;

Если вы хотите найти фразу целиком - заключите ее в кавычки;

Если вы вводите запрос к поисковой машине, состоящий из нескольких слов, то в результате получаете список документов, в которых встречается хотя бы одно слово.

Стоит отметить, что поисковая машина обычно производит сортировку документов по принципу релевантности.

Итак, что же такое релевантность. При индексации документов поисковые машины высчитывают так называемый "вес" слова на странице - соотношение количества повторов на странице заданного Вами слова к общему количеству слов на странице документа. Если Вы задаете запрос, состоящий из нескольких слов, то более релевантными будут документы, в которых совокупный вес слов будет максимальный. Однако, при подсчете веса не учитывается, рядом или раздельно стоят данные слова, и поэтому нет гарантий, что в первых документах содержится максимальное количество повторений словосочетания. Вполне возможно, что такого словосочетания там вообще не будет.

Поэтому, если Вы хотите найти заданное словосочетание - задавайте запрос в окне поисковой машины в кавычках. В этом случае будет высчитываться вес словосочетания целиком. Соответственно, гарантируется наличие именно данного словосочетания в найденных документах.

К-во Просмотров: 333
Бесплатно скачать Реферат: Методы поиска и анализа информации