Модератор

Поисковые каталоги

Каталоги в WWW аналогичны систематизированным библиотечным каталогам. Поиск по каталогам состоит в последовательном движении по иерархическому списку ссылок, называемых рубриками или категориями.

На первой странице каталога содержатся ссылки на крупные темы, например, Культура и искусство, Общество и политика, Бизнес и др.

Щелчок на соответствующей категории открывает страницу, содержащую ссылки, детализирующие выбранную тему (рубрики). Двигаясь вниз по детализирующим категориям, можно найти страницы с нужной информацией.

Некоторые каталоги поддерживают возможность быстрого поиска определенной категории или страницы по ключевым словам с помощью локальной поисковой машины.

Результат поиска в каталоге представляется в виде списка, состоящего из краткого описания (аннотации) документов с гипертекстовой ссылкой на первоисточник.

Все каталоги создаются и поддерживаются в актуальном состоянии специалистами, аналогично тому, как библиографы составляют и поддерживают библиотечные каталоги.

Сотрудник фирмы, отвечающий за содержимое каталога (его отдельного раздела, подраздела и т.д.), за его достоверность, надёжность и актуальность. Модератора иногда называют гидом поисковой машины (системы).

Благодаря этому содержание страниц, включенных в каталог, наиболее адекватно соответствует рубрике, к которой они отнесены, а поиск по каталогам дает более релевантные результаты, чем поиск по поисковым системам.

Каталоги могут быть глобальные, национальные, общие и специализированные (отраслевые, тематические и т.д.).

Основными параметрами, характеризующими достоинства каталогов, являются:

Ø объем - определяет степень надежности или «информационной прочности». От этого зависит уровень доверия, который пользователи питают к конкретному каталогу.

Ø оперативность отражения новых или изменившихся ресурсов - насколько оперативно появляются ссылки на новые сайты, и исправляются или удаляются ссылки на устаревшие ресурсы. В некоторых системах существует специальный механизм, периодически проверяющий доступность сайта и исключающий его из перечня при долгом «отсутствии» в Сети;

Ø логичность и последовательность иерархической схемы классификации - определяет степень простоты, с которой пользователи могут находить требуемые сведения;

Ø перекрестность структуры - позволяет выявлять информацию, используя разные подходы (например, территориальный или отраслевой). В этом случае схема классификации должна автоматически выводить пользователя на искомый объект, какой бы путь поиска не был выбран.

Основная проблема поисковых каталогов – низкий коэффициент охвата Web-ресурсов.


Адреса популярных каталогов:

Российские каталоги:

Улитка

Russia of the net (www.ru) – один из старейших каталогов, основан в 1995 году.

Зарубежные каталоги:

http://www.yahoo.com/

Система запущена в начале 1994 года. Yahoo! является одним из самых первых, надежных и авторитетных каталогов. У каталога два основных достоинства: - внушительный объем (на сегодня отражено порядка 2 миллионов сайтов в более чем 25 тысячах категорий) и научность и логичность используемой схемы классификации. У yahooимеется поисковый каталог для детей и поисковик на русском языке.

http://www.dmoz.org- каталог начал предоставлять свои услуги в июне 1998 года. Имеет базу данных с более 2 млн. проиндексированных сайтов, 28.000 редакторов и 304.000 категорий. Разработчики хотели создать каталог больше и лучше, чем Yahoo.

Поисковые машины (поисковые серверы, поисковые роботы)

По области действия поисковые машины можно разделить на глобальные, которые осуществляют поиск на многих языках без учёта имени домена, и локальные, которые осуществляют поиск в пределах определённого домена, например, национального, на определенном языке.

Поисковые системы состоят из следующих основных частей:

1. Робот (Robot, или Spider). Это программа, которая посещает Web-страницы, считывает (индексирует) полностью или частично их содержимое и далее следует по ссылкам, найденным на данной странице. Spider автоматически возвращается через определенные периоды времени и индексирует страницу снова.

2. Индексы. Все, что находит и считывает Spider, попадает в индексы поисковой системы. Индексы системы представляют собой гигантское вместилище информации, где хранится преобразованная особым образом текстовая составляющая всех посещенных и проиндексированных Spider страниц.

3. Поисковая программа. В соответствии с запросом пользователя эта программа перебирает индексы поисковой системы в поисках информации, интересующей пользователя, и выдает ему найденные документы в порядке убывания релевантности.

К основным параметрам, характеризующим достоинства поисковых машин, относятся:

- объем индексных файлов или широта охвата материала (число проиндексированных серверов и отдельных документов) – до 3 с лишним миллиардов документов;

- степень оперативности обновления базы данных за счет включения сведений о новых материалах и удаления устаревших – от двух недель до полутора месяцев;

- возможности для составления запроса – предопределяет долю релевантных документов в перечне полученных документов;

- интеллектуальность системы ранжирования результатов поиска - перечень факторов, принимаемых во внимание при определении места документа в перечне ссылок необычайно широк: от местоположения слова на странице до рейтинга (авторитета) страниц, имеющих ссылки на найденный документ;

- наличие дополнительных сервисных функций, облегчающих работу пользователя - возможность перевода текста документа на иностранный язык, способность выделять все документы с определенного сайта, сужение критериев в ходе поиска, нахождение документов "по образцу" и т.д.

Достоинство автоматизированного поиска состоит в том, что он обеспечивает просмотр очень больших объемов информации.

Адреса наиболее популярных поисковых машин:

Зарубежные поисковые машины:

http://www.google.com/

http://www.altavista.com/

Система открыта в декабре 1995 года.

http://www.excite.com/

Система открыта в конце 1995 года

http://www.hotbot.com/

Система запущена в мае 1996 года.

www.lycos.com

Система запущена примерно в мае 1994 года.

Российские поисковые машины:

http://www.yandex.ru/ (илиhttp://www.ya.ru/) Сайт компании, Yandex.ru, был открыт 23 сентября 1997 года.


http://www.rambler.ru/Rambler создан в 1996 году.

http://www.aport.ru/действует в Интернете с 1996 года.