Модератор
Поисковые каталоги
Каталоги в WWW аналогичны систематизированным библиотечным каталогам. Поиск по каталогам состоит в последовательном движении по иерархическому списку ссылок, называемых рубриками или категориями.
На первой странице каталога содержатся ссылки на крупные темы, например, Культура и искусство, Общество и политика, Бизнес и др.
Щелчок на соответствующей категории открывает страницу, содержащую ссылки, детализирующие выбранную тему (рубрики). Двигаясь вниз по детализирующим категориям, можно найти страницы с нужной информацией.
Некоторые каталоги поддерживают возможность быстрого поиска определенной категории или страницы по ключевым словам с помощью локальной поисковой машины.
Результат поиска в каталоге представляется в виде списка, состоящего из краткого описания (аннотации) документов с гипертекстовой ссылкой на первоисточник.
Все каталоги создаются и поддерживаются в актуальном состоянии специалистами, аналогично тому, как библиографы составляют и поддерживают библиотечные каталоги.
Сотрудник фирмы, отвечающий за содержимое каталога (его отдельного раздела, подраздела и т.д.), за его достоверность, надёжность и актуальность. Модератора иногда называют гидом поисковой машины (системы).
Благодаря этому содержание страниц, включенных в каталог, наиболее адекватно соответствует рубрике, к которой они отнесены, а поиск по каталогам дает более релевантные результаты, чем поиск по поисковым системам.
Каталоги могут быть глобальные, национальные, общие и специализированные (отраслевые, тематические и т.д.).
Основными параметрами, характеризующими достоинства каталогов, являются:
Ø объем - определяет степень надежности или «информационной прочности». От этого зависит уровень доверия, который пользователи питают к конкретному каталогу.
Ø оперативность отражения новых или изменившихся ресурсов - насколько оперативно появляются ссылки на новые сайты, и исправляются или удаляются ссылки на устаревшие ресурсы. В некоторых системах существует специальный механизм, периодически проверяющий доступность сайта и исключающий его из перечня при долгом «отсутствии» в Сети;
Ø логичность и последовательность иерархической схемы классификации - определяет степень простоты, с которой пользователи могут находить требуемые сведения;
Ø перекрестность структуры - позволяет выявлять информацию, используя разные подходы (например, территориальный или отраслевой). В этом случае схема классификации должна автоматически выводить пользователя на искомый объект, какой бы путь поиска не был выбран.
Основная проблема поисковых каталогов – низкий коэффициент охвата Web-ресурсов.
Адреса популярных каталогов:
Российские каталоги:
Улитка
Russia of the net (www.ru) – один из старейших каталогов, основан в 1995 году.
Зарубежные каталоги:
http://www.yahoo.com/
Система запущена в начале 1994 года. Yahoo! является одним из самых первых, надежных и авторитетных каталогов. У каталога два основных достоинства: - внушительный объем (на сегодня отражено порядка 2 миллионов сайтов в более чем 25 тысячах категорий) и научность и логичность используемой схемы классификации. У yahooимеется поисковый каталог для детей и поисковик на русском языке.
http://www.dmoz.org- каталог начал предоставлять свои услуги в июне 1998 года. Имеет базу данных с более 2 млн. проиндексированных сайтов, 28.000 редакторов и 304.000 категорий. Разработчики хотели создать каталог больше и лучше, чем Yahoo.
Поисковые машины (поисковые серверы, поисковые роботы)
По области действия поисковые машины можно разделить на глобальные, которые осуществляют поиск на многих языках без учёта имени домена, и локальные, которые осуществляют поиск в пределах определённого домена, например, национального, на определенном языке.
Поисковые системы состоят из следующих основных частей:
1. Робот (Robot, или Spider). Это программа, которая посещает Web-страницы, считывает (индексирует) полностью или частично их содержимое и далее следует по ссылкам, найденным на данной странице. Spider автоматически возвращается через определенные периоды времени и индексирует страницу снова.
2. Индексы. Все, что находит и считывает Spider, попадает в индексы поисковой системы. Индексы системы представляют собой гигантское вместилище информации, где хранится преобразованная особым образом текстовая составляющая всех посещенных и проиндексированных Spider страниц.
3. Поисковая программа. В соответствии с запросом пользователя эта программа перебирает индексы поисковой системы в поисках информации, интересующей пользователя, и выдает ему найденные документы в порядке убывания релевантности.
К основным параметрам, характеризующим достоинства поисковых машин, относятся:
- объем индексных файлов или широта охвата материала (число проиндексированных серверов и отдельных документов) – до 3 с лишним миллиардов документов;
- степень оперативности обновления базы данных за счет включения сведений о новых материалах и удаления устаревших – от двух недель до полутора месяцев;
- возможности для составления запроса – предопределяет долю релевантных документов в перечне полученных документов;
- интеллектуальность системы ранжирования результатов поиска - перечень факторов, принимаемых во внимание при определении места документа в перечне ссылок необычайно широк: от местоположения слова на странице до рейтинга (авторитета) страниц, имеющих ссылки на найденный документ;
- наличие дополнительных сервисных функций, облегчающих работу пользователя - возможность перевода текста документа на иностранный язык, способность выделять все документы с определенного сайта, сужение критериев в ходе поиска, нахождение документов "по образцу" и т.д.
Достоинство автоматизированного поиска состоит в том, что он обеспечивает просмотр очень больших объемов информации.
Адреса наиболее популярных поисковых машин:
Зарубежные поисковые машины:
http://www.google.com/
http://www.altavista.com/
Система открыта в декабре 1995 года.
http://www.excite.com/
Система открыта в конце 1995 года
http://www.hotbot.com/
Система запущена в мае 1996 года.
www.lycos.com
Система запущена примерно в мае 1994 года.
Российские поисковые машины:
http://www.yandex.ru/ (илиhttp://www.ya.ru/) Сайт компании, Yandex.ru, был открыт 23 сентября 1997 года.
http://www.rambler.ru/Rambler создан в 1996 году.
http://www.aport.ru/действует в Интернете с 1996 года.