Поиск информации в сети Интернет

 

В 80-е годы сеть Internet служила в основном исследовательской средой. Файлы хранились отдельно друг от друга, и не было способа, позволяющего легко переходить от одного из них к другому. В 1991 году Тим Бернерс-Ли разработал принцип объединения в сеть файлов, связанных гипертекстовыми ссылками; сегодня такую сеть называют World Wide Web. Популярность Web резко возросла после создания броузеров, позволяющих просматривать текст и графику и быстро переходить от страницы к странице. Затем потребовался способ, с помощью которого пользователи могли бы быстро находить необходимую им информацию, и именно поэтому были созданы машины поиска.

 

Глобальная сеть Internet, объединяющая гигантские информационные ресурсы, оставалась бы колоссальным банком данных, малоизвестных и потому малодоступных. Конечно, начальная страница по интересующей тематике и дальнейшие гипертекстовые ссылки рано или поздно выведут на необходимую информацию, но как найти нужные страницы среди сотен миллионов, даже если известно, что интересующая информация организована в гипертекстовые ссылки. Мощные поисковые службы обеспечивают быстрый поиск и доступ практически ко всей информации, находящейся в Internet.

Машина поиска – это приложение базы данных, которое выбирает информацию с учетом переданных ему слов или выражений. Имеющийся на машине агент поиска (его также называют spide - паук) отправляется на поиски информации в Web-страницах. Эта информация индексируется и записывается в огромную базу данных. При проведении операции машина поиска просматривает свою базу данных и ищет «входы», которые соответствуют введенной пользователем информации. Затем она предоставляет пользователю перечень Web-страниц, определив их как наиболее соответствующие заданным критериям поиска.

В Web существуют десятки машин поиска, каждая из которых имеет свои особенности сбора информации. Одни машины просматривают всю Web-страницу, другие сосредоточиваются на заголовке страницы, а треть просто считывают ключевые слова и информацию, имеющуюся в тегах META (теги, которые включают ключевые слова с описанием содержимого страницы) на Web-странице. Вот почему различные машины поиска выдают разные результаты.

Наиболее известные русскоязычные (т.е. информация, находящаяся на Web-страницах на русском языке) поисковые машины:www.aport.ru,www.yandex.ru,www.rambler.ru и т.д. А наиболее распространенные англоязычные поисковые системы: home.netscape.com, www.hotbot.com, www.infoseek.com, www.lycos.com, www.altavista.com и т.д. Также существует множество поисковых систем, которые находят информацию как на русском языке, так и на английском. Например: www.google.com.