Обзор поисковых систем Интернета

 

Поиск информации на Web-страницах сети Интернет удобно проводить с помощью поисковых машин «Altavista», «Google», «Теоmа», «Snар», «Yahoo» , «Оingo», «Апорт», «Yndex», «Rambler».

Аltavista (www.altavista.com) - поисковая система, вклю­чающая в свою базу данных тексты на разных языках (в основ­ном, на английском). Индекс «Аltavista» - один из самых боль­ших в мире (включает в себя более 200 млн. страниц).

Сооglе (www.google.com) - поисковая система с простым языком запросов, хорошо приспособленная для начального поиска. «Сооglе» не различает прописных и строчных букв, ищет доку­менты, в которых есть все указанные в строке поиска слова. Если указаны два слова, то «Google» покажет только те документы, где есть оба слова. Если перед каким-либо словом поставить знак ми­нус, то «Google» найдет только те страницы, где нет помеченного минусом слова, например: Clinton -Lewinsky. Индекс «Google» способен искать фразы, при этом фраза отмечается кавычками, например: "Bill Clinton".

Поисковый робот «Google» ведет учет внешних ссылок на проиндексированную им страницу, поскольку предполагается, что сайт или страница, на которые очень часто ссылаются созда­тели других Интернет-ресурсов, более авторитетны, а значит, бу­дут более полезны ищущему (технологии «РаgеRank»). Подклю­чив, таким образом, к своему поисковому механизму десятки ты­сяч ответственных за свои собственные сайты граждан и компа­ний, «Google» быстро вырвался в технологические лидеры среди систем поиска.

Тeoma (www.teoma.com) следит не только за тем, какие страницы выбираются, но и за тем, как долго посетитель там за­держивается. Часто выбираемые и подолгу рассматриваемые страницы «Теоmа» показывает первыми. Люди, того не подозре­вая, «голосуют» за те документы, которые им понравились, при­влекли внимание.

Snaр (www.snap.com) - поисковая система для начального поиска. По одному слову можно получить связанные с ним попу­лярные сайты, разделы тематического каталога, близкие по теме слова и фразы.

Yahoo! (www.yahoo.com) является тематическим каталогом, подобным рассмотренному ранее каталогу «Ulitka». Разница только в размерах. Если в «Ulitka» около 16 000 адресов страниц и сайтов, то в самом большом каталоге Интернета «Уahoo!» их более миллиона.

«Уаhoо!», как и любой тематический каталог, построен в ви­де дерева: сначала идут основные рубрики (главные ветви); руб­рики разбиты на разделы (ветви), разделы - на подразделы (маленькие ветви и побеги), и так до тех пор, пока не появятся описания сайтов и ссылки на них (листья). Каждое описание сайта делается специальным редактором (всего их в «Уаhоо!» около 50). Каждый месяц к «Уаhоо!» обращается более 50 млн. человек.

В отличие от «Теоmа», «Сооglе» и «Snap», сайты в разделах «Уаhоо!» не расставлены в порядке убывания «важности». Рабо­тающий с 1994 г., «Уаhоо!» не имеет никаких средств измерения популярности. Значок, похожий на очки, стоящий справа от на­звания сайта, указывает на то, что редакторы рекомендуют его для знакомства с темой.

В «Уаhоо!» есть свой язык запросов, поскольку информация, нужная пользователю (нужный раздел каталога), находится не всегда. Во-первых, потому, что каталог, содержащий множество адресов, имеет сложную структуру, и необходимый раздел может затеряться в его недрах. Во-вторых, нужные сведения могут быть разбросаны по разным разделам каталога.

Когда в каталоге «Уаhоо!» не найдется нужных слов или фраз, он обратится к индексу «Сооglе» и попытается найти нуж­ные слова или фразы уже в самих документах, а не в их названи­ях. Для более детальных запросов можно использовать префиксы t: и u:. Префикс t:, поставленный перед словом, означает поиск только в заголовках страниц и сайтов; префикс u: задает поиск только в адресах сайтов.

Система Оinhо(www.oingo.com) в отличие от многих других поисковых систем, воспринимающих слова как простые последо­вательности символов, способна понимать их смысл. Сначала поиск проходит так же, как и в любом другом каталоге, - ищутся все сайты, где встречается заданное для поиска слово (или фраза). Однако, это слово может иметь самые различные значения (на­пример, слово «king» имеет значения «бог», «царь», «магнат», «шахматный король», «карточный король» и др.). Системе «Оingo» известны многие значения слов, и «Оingo» позволяет пользователю выбрать нужное значение. После уточнения запро­са пользователь ищет сайты и страницы с нужным значением слова. Если «Оingо» не может ничего найти в своем каталоге, он обращается к мощному индексу «Аltavista».

При поиске редких документов лучше и надежнее опраши­вать одновременно несколько поисковых систем, устранять оди­наковые адреса и выдавать на экран информацию в удобном для ищущего виде. Именно по такому принципу работают ведущие метапоисковые системы: «МеtаСrаwler» (www.metacrawler.com), Dogpile (www.dogpile.com), «Маmmа» (www.mamma.com), Ixquick (www.ixquick.com). Метапоисковые системы не имеют собственных баз данных и использует базы данных традицион­ных поисковиков при осуществлении поиска. Наряду с достоин­ствами, метапоисковым системам присущи и недостатки: выдает­ся только часть адресов, найденных каждым индексом; нельзя использовать достаточно мощный язык запросов - каждый ин­декс использует свой язык.