ПОШУК ІНФОРМАЦІЇ У WORLD WIDE WEB


 

Інтернет відкриває доступ до велетенських обсягів інформації. Кажуть, що в Інтернеті є все, проблема лише в тому, щоб розшукати потрібну інформацію. Основна складність по- лягає в тому, що Інтернет не є централізованою системою. Тому, на відміну, скажімо, від бібліотеки, де надходження нових книг належним чином реєструється у відповідних ката- логах, в Інтернеті величезні обсяги інформації щодня з’являються і зникають без будь-якої реєстрації. Пошуком інформації з більшим чи меншим успіхом займаються різноманітні пошукові системи – спеціальні сервери, які постійно відслідковують певні сегменти Інтер- нету, надаючи своїм користувачам послуги з пошуку інформації за допомогою каталогів та індексів.

Каталогипошукової системи (див. рис. 7.1) організовані аналогічно систематичним ка- талогам бібліотек, що містять ієрархію тематичних розділів (наприклад: Держава і суспіль- ство, Наука і освіта, Бізнес і фінанси тощо), які, в свою чергу, можуть поділятися на більш детальні підрозділи і т.д. Ведення і поповнення каталогів також організоване як у бібліоте- ках. Цим займаються співробітники, що забезпечують функціонування пошукової системи. Певну допомогу надають їм і автори веб-сайтів, зацікавлені в тому, щоб їхні інформаційні ресурси були відомі і доступні якомога більшому числу користувачів.

Перевагою каталогів є чітка і впорядкована структурна організація, проте ведення ка- талогів вимагає значних обсягів людської праці, тому каталоги не спроможні відслідковува- ти всю наявну в Інтернеті інформацію, до того ж, досить часто буває важко однозначно від- нести сторінку чи сайт до того чи іншого розділу, а отже, і скористатися каталогом для їх пошуку.

Індексипошукової системи автоматично формуються за допомогою потужних ком- п'ютерів, що постійно переглядають Інтернет, збираючи всю інформацію у велетенські ін- дексні файли, які дозволяють користувачам виконувати пошук інформації за ключовими словами.

Дійсно, комп'ютери можуть дуже швидко індексувати (тобто впорядковувати за алфа- вітом) великі масиви слів. Сервери пошукових систем виконують цю роботу для всієї інфор- мації, яку вони знаходять у Інтернеті. Індексний файл нагадує словник, в якому слова впо- рядковані за алфавітом і поряд з кожним словом розміщується інформація про те, з якої веб-


сторінки воно взяте. Отримавши запит на пошук інформації за ключовими словами, пошу- кова система швидко знаходить їх в своєму індексному файлі і надсилає нам перелік веб- сторінок, в яких ці слова зустрічаються.

Пошукові системи знають граматичні форми мов, з якими вони працюють: Rambler, Яndex та Апорт – російської, Мета – української і російської тощо. Наприклад, якщо в цих системах набрати ключові слова человек идет, то сторінки з текстом люди шли також бу- дуть знайдені, не кажучи вже про однокорінні слова, що відрізняються лише відмінком, ро- дом, числом і т.п. Натомість так звані стоп-слова (прийменники, займенники, деякі інші ча- сто вживані слова), як правило, ігноруються пошуковими системами, бо зустрічаються практично у кожному документі, а отже не несуть корисної для пошуку інформації.

Перевагою індексів є те, що вони створюються автоматично і тому швидко оновлю- ються і охоплюють значно більші обсяги інформації, ніж каталоги. Недоліком є те, що знайдені ключові слова можуть використовуватися в зовсім іншому значенні чи контексті. Часто трапляється, що знайдена інформація хоч і містить ці ключові слова, проте не має ні- чого спільного з тим, що ми насправді розшукуємо.

Деякі пошукові системи взагалі не мають каталогів і використовують тільки індекси. На- впаки, є пошукові системи, такі як www.list.mail.ru, www.weblist.ru, www.ru, www.ulitka.ru, що відзначаються перш за все великим обсягом і зручною організацією каталогів, хоча у них є мож- ливість пошуку і за індексами, в тому числі в межах вибраного вами розділу каталогу.

Аналізуючи результати пошуку, не слід забувати й про те, що за час, який минув від мо- менту створення каталогів та індексів до моменту, коли ми ними скористалися, інформація на веб-сторінках могла змінитися, а частина сторінок може бути тимчасово чи вже остаточно недо- ступною. В таких випадках користувач має можливість одержати від пошукової системи інфор- мацію про зміст веб-сторінки, який вона мала на час створення індексного файла.

Перелік найпопулярніших пошукових систем подано в табл. 7.2.

 

Таблиця 7.2.

 

Пошукова система Адреса в Інтернеті Мова інтерфейсу Охоплює переважно
Мета www.meta.ua Укр., рос., англ. Україну
Google www.google.com.ua Укр., рос., англ. Весь світ
Rambler www.rambler.ru Російська Росію та СНД4
Яndex www.yandex.ru Рос., англ. Росію та СНД
Апорт www.aport.ru Російська Росію та СНД
    AltaVista www.altavista.com www.fr.altavista.com www.de.altavista.com www.es.altavista.com Англійська Французька Німецька Іспанська   Америку, Західну Європу
    Yahoo www.yahoo.com www.fr.yahoo.com www.de.yahoo.com www.es.yahoo.com Англійська Французька Німецька Іспанська   Америку, Західну Європу
  Lycos   www.lycos.com   Англійська Америку, Західну Євро- пу
  Hotbot   www.hotbot.com   Англійська Америку, Західну Європу

 

 

4 Ця частина Інтернету має неофіційну назву Рунет (ru – домен Росії в URL, net – мережа).


Щоб скористатися пошуковою системою, треба відкрити її веб-сторінку, вибрати по- трібний каталог та його підкаталоги або ввести ключові слова у відповідне поле і натиснути кнопку пошуку чи клавішу Enter.

Існують також так звані сторінки метапошуку, наприклад, www.find.ru, через які мож-

на послати запити до декількох пошукових систем одночасно.

Подібний засіб є також у складі самої програми Internet Explorer. Щоб ним скориста- тися, натисніть на панелі інструментів кнопку Поиск, виберіть у вікні Поиск категорію по- шуку: Поиск веб-страницы, введіть ключові слова і натисніть кнопку пошуку чи клавішу Enter. Результати пошуку відображатимуться у вікні Поиск. Щоб виконати пошук тих самих ключових слів у наступній пошуковій системі, натисніть кнопку Следующий. Кнопка На- стройка дозволяє задати перелік пошукових систем і послідовність, в якій вони застосову- ватимуться.

Вікно Поиск зберігає також результати десяти попередніх пошуків. Щоб їх перегля- нути, виберіть радіокнопку Предыдущий поиск та знайдіть у списку ключові слова, за якими виконувався цей пошук.