Системы мета поиска
Читая обо всех перечисленных поисковых службах, по неволе задумаешься: "а если для поиска необходимой информации не достаточно одной поисковой службы, то неужели придется входить на все перечисленные сервера и каждый раз повторять один и тот же запрос?!". Наиболее качественный результат как раз будет именно при таком подходе. Но можно, исходя из экономии времени и денег, воспользоваться системами мета поиска. Основа метапоисковых систем - это интерфейс между пользователем и множеством поисковых систем. Метапоисковая система не предназначена для индексирования и накопления информации. Назначение ее - чистый поиск и обработка результатов поиска. В настоящее время в Интернете представлены Серверы, которые позволяют осуществлять одновременный поиск по нескольким базам данных. Наиболее популярная в мире система такого класса Search.com (http://www.search.com). Это достаточно мощная система направляющая ваш запрос на 13 крупнейших поисковых машин (в том числе и российских) и возвращающая вам их отчеты. Также широко известной является WebCrawler (http://www.webcrawler.com). Поисковая машина Dogpile (http://www.dogpile.com) обеспечивает поиск по 14 базам данных Интернета, представленным в одном экране. Эти базы данных включают Alta Vista, Yaho, Lycos и другие. Другая российская система мета поиска "Следопыт" (http://www.medialingua.ru/) работает только с 5 англоязычными поисковыми машинами и 1 русскоязычной, но интересна тем, что переводит ваш русскоязычный запрос на английский язык для англоязычных поисковых машин.
Основной чертой метапоисковых систем нового поколения является объединение поисковых серверов различных специализаций. В рамках одного приложения можно осуществлять поиск информации различного типа. При обработке поискового запроса допускается соединение более чем со 100 поисковыми системами (в т.ч. и со специализированными). Результаты поиска дополнительно обрабатываются: ссылки, дублирующие уже найденные, системой исключаются; полученные адреса проверяются на доступность. Есть возможность конфигурации работы с поисковыми серверами (можно выбрать серверы, с которыми будет работать система, указать максимальное число ссылок, получаемых с каждого сервера и т.д.).
Сторонники такого мета-поиска полагают, что использование большого перечня поисковых машин существенно улучшает информативность поиска. Хотя эти и так, но теневой стороной этого утверждения является то, что поиск информации осуществляется не по объединенной базе данных всех поисковых машин, а его необходимо все равно проводить в базе каждой поисковой машины отдельно. В итоге пользователь нередко набирает, с одной стороны, практически необозримое число веб-страниц, а с другой, в каждом из списков, которые представляет отдельная поисковая машина, оказывается много документов, представляемых другими поисковыми машинами, то есть информация дублируется. Кроме того, время поиска также существенно увеличивается.
Также существуют так называемые мультипоисковые страницы, например:
Search (http://www.informika.ru/windows/intern/poisk/main.html).
Эти сервера не умеют посылать запросы и получать отчеты от поисковых служб как системы мета поиска. Мультипоисковые страницы загружают во множестве окон поисковые службы и передают им ваш запрос.
В связи с вышесказанным, наиболее целесообразно использовать этот подход к поиску лишь в тех случаях, когда заведомо ищется какая-то очень редкая и необычная информация, и поэтому удобнее организовывать поиск с какой-то одной веб-страницы в Интернете, где представлен набор ведущих поисковых машин, чем разыскивать отдельные поисковые машины в сети.