Поиск информации в Интернет.


В настоящее время для поиска информации в Интернет наиболее широко используется служба www.

Основные источники информации в www:

Ø информационные агентства;

Ø средства массовой информации;

Ø специализированные базы данных;

Ø Web-сайты юридических и физических лиц.

Эти ресурсе хранятся в форме файлов стандартных форматов или разного рода документов, которые можно просмотреть, распечатать, сохранить.

Информационные агентства являются источником наиболее достоверной и оперативной информации о различных событиях и явлениях в различных сферах жизни. Эти агентства располагают развитой сетью корреспондентских пунктов. Они являются наиболее объективными и точными источниками информации, в меньшей степени подверженных конъюнктурным влияниям. Авторитетные российские агентства: ИТАР-ТАСС, ИНТЕРФАКС, РИА «Новости». Они имеют свои сайты в Интернет.

Средства массовой информации (СМИ). Информация на сайтах традиционных СМИ менее оперативна из-за дискретности выхода номеров изданий (ежедневное издание, еженедельное, ежемесячное и так далее). информация от агентств журналистами в СМИ разбавляется сведениями из собственных источников, и она становится основой для публикаций, отражающих точку зрения либо авторов, либо руководства изданий.

Один из крупнейших собственников СМИ – Правительство РФ. Его официальный сайт находится по адресу http://www.gov.ru. Собственными СМИ располагают Федеральное собрание РФ, правительство Москвы, министерства, «Газпром», финансово-промышленная группа «Интеррос» и другие.

Специализированные базы данных в Интернет – это сайты, поддерживаемые, как правило, информационными или консалтинговыми фирмами. В них сконцентрированы данные из многих СМИ. Их преимущество – возможность поиска с использованием специализированных языков запросов. Примером таких баз информационно-поисковая система «Артефакт» (http://www.intergrum.com), информационно-аналитическая система «Галактика-Zoom» (http://www.zoom2.galaktuka.ru) и межуниверситетская информационная система «Россия» (http://www.cir.ru)/

В настоящее время общее число документов в www превышает миллиард, что порождает проблему поиска нужной информации.

Используются три способа поиска информации в www:

1. Поиск по адресу – если известен адрес Web-сайта. Форма адреса может быть любой (IP, доменный или URL).

2. Поиск по гиперссылкам – используются гиперссылки на том или ином Web-сайте.

3. Поиск с помощью поисковых серверов. Такая возможность обеспечивается наличием в Интернет поисковых серверов. Поисковые серверы – выделенные хост-компьютеры, в которых размещены базы данных ресурсов Интернет. Достаточно передать такому серверу фразу или набор ключевых слов, описывающих тему, и сервер предоставит список ресурсов по интересующей теме. Все информационно-поисковые системы имеют специальную базу данных, в которой содержится описание документов в сети на определенный момент времени (в сети могут изменяться, появляться новые и исчезать существующие документы и целые сайты, так как нет единого администрирования).

При запросе по данным о документе в базе данных осуществляется проверка документа на соответствие запросу, то есть соответствие определяется не по тексту документа, а по его описанию в базе данных.