ПОШУК ІНФОРМАЦІЇ У WORLD WIDE WEB
Інтернет відкриває доступ до велетенських обсягів інформації. Кажуть, що в Інтернеті є все, проблема лише в тому, щоб розшукати потрібну інформацію. Основна складність по- лягає в тому, що Інтернет не є централізованою системою. Тому, на відміну, скажімо, від бібліотеки, де надходження нових книг належним чином реєструється у відповідних ката- логах, в Інтернеті величезні обсяги інформації щодня з’являються і зникають без будь-якої реєстрації. Пошуком інформації з більшим чи меншим успіхом займаються різноманітні пошукові системи – спеціальні сервери, які постійно відслідковують певні сегменти Інтер- нету, надаючи своїм користувачам послуги з пошуку інформації за допомогою каталогів та індексів.
Каталогипошукової системи (див. рис. 7.1) організовані аналогічно систематичним ка- талогам бібліотек, що містять ієрархію тематичних розділів (наприклад: Держава і суспіль- ство, Наука і освіта, Бізнес і фінанси тощо), які, в свою чергу, можуть поділятися на більш детальні підрозділи і т.д. Ведення і поповнення каталогів також організоване як у бібліоте- ках. Цим займаються співробітники, що забезпечують функціонування пошукової системи. Певну допомогу надають їм і автори веб-сайтів, зацікавлені в тому, щоб їхні інформаційні ресурси були відомі і доступні якомога більшому числу користувачів.
Перевагою каталогів є чітка і впорядкована структурна організація, проте ведення ка- талогів вимагає значних обсягів людської праці, тому каталоги не спроможні відслідковува- ти всю наявну в Інтернеті інформацію, до того ж, досить часто буває важко однозначно від- нести сторінку чи сайт до того чи іншого розділу, а отже, і скористатися каталогом для їх пошуку.
Індексипошукової системи автоматично формуються за допомогою потужних ком- п'ютерів, що постійно переглядають Інтернет, збираючи всю інформацію у велетенські ін- дексні файли, які дозволяють користувачам виконувати пошук інформації за ключовими словами.
Дійсно, комп'ютери можуть дуже швидко індексувати (тобто впорядковувати за алфа- вітом) великі масиви слів. Сервери пошукових систем виконують цю роботу для всієї інфор- мації, яку вони знаходять у Інтернеті. Індексний файл нагадує словник, в якому слова впо- рядковані за алфавітом і поряд з кожним словом розміщується інформація про те, з якої веб-
сторінки воно взяте. Отримавши запит на пошук інформації за ключовими словами, пошу- кова система швидко знаходить їх в своєму індексному файлі і надсилає нам перелік веб- сторінок, в яких ці слова зустрічаються.
Пошукові системи знають граматичні форми мов, з якими вони працюють: Rambler, Яndex та Апорт – російської, Мета – української і російської тощо. Наприклад, якщо в цих системах набрати ключові слова человек идет, то сторінки з текстом люди шли також бу- дуть знайдені, не кажучи вже про однокорінні слова, що відрізняються лише відмінком, ро- дом, числом і т.п. Натомість так звані стоп-слова (прийменники, займенники, деякі інші ча- сто вживані слова), як правило, ігноруються пошуковими системами, бо зустрічаються практично у кожному документі, а отже не несуть корисної для пошуку інформації.
Перевагою індексів є те, що вони створюються автоматично і тому швидко оновлю- ються і охоплюють значно більші обсяги інформації, ніж каталоги. Недоліком є те, що знайдені ключові слова можуть використовуватися в зовсім іншому значенні чи контексті. Часто трапляється, що знайдена інформація хоч і містить ці ключові слова, проте не має ні- чого спільного з тим, що ми насправді розшукуємо.
Деякі пошукові системи взагалі не мають каталогів і використовують тільки індекси. На- впаки, є пошукові системи, такі як www.list.mail.ru, www.weblist.ru, www.ru, www.ulitka.ru, що відзначаються перш за все великим обсягом і зручною організацією каталогів, хоча у них є мож- ливість пошуку і за індексами, в тому числі в межах вибраного вами розділу каталогу.
Аналізуючи результати пошуку, не слід забувати й про те, що за час, який минув від мо- менту створення каталогів та індексів до моменту, коли ми ними скористалися, інформація на веб-сторінках могла змінитися, а частина сторінок може бути тимчасово чи вже остаточно недо- ступною. В таких випадках користувач має можливість одержати від пошукової системи інфор- мацію про зміст веб-сторінки, який вона мала на час створення індексного файла.
Перелік найпопулярніших пошукових систем подано в табл. 7.2.
Таблиця 7.2.
Пошукова система | Адреса в Інтернеті | Мова інтерфейсу | Охоплює переважно |
Мета | www.meta.ua | Укр., рос., англ. | Україну |
www.google.com.ua | Укр., рос., англ. | Весь світ | |
Rambler | www.rambler.ru | Російська | Росію та СНД4 |
Яndex | www.yandex.ru | Рос., англ. | Росію та СНД |
Апорт | www.aport.ru | Російська | Росію та СНД |
AltaVista | www.altavista.com www.fr.altavista.com www.de.altavista.com www.es.altavista.com | Англійська Французька Німецька Іспанська | Америку, Західну Європу |
Yahoo | www.yahoo.com www.fr.yahoo.com www.de.yahoo.com www.es.yahoo.com | Англійська Французька Німецька Іспанська | Америку, Західну Європу |
Lycos | www.lycos.com | Англійська | Америку, Західну Євро- пу |
Hotbot | www.hotbot.com | Англійська | Америку, Західну Європу |
4 Ця частина Інтернету має неофіційну назву Рунет (ru – домен Росії в URL, net – мережа).
Щоб скористатися пошуковою системою, треба відкрити її веб-сторінку, вибрати по- трібний каталог та його підкаталоги або ввести ключові слова у відповідне поле і натиснути кнопку пошуку чи клавішу Enter.
Існують також так звані сторінки метапошуку, наприклад, www.find.ru, через які мож-
на послати запити до декількох пошукових систем одночасно.
Подібний засіб є також у складі самої програми Internet Explorer. Щоб ним скориста- тися, натисніть на панелі інструментів кнопку Поиск, виберіть у вікні Поиск категорію по- шуку: Поиск веб-страницы, введіть ключові слова і натисніть кнопку пошуку чи клавішу Enter. Результати пошуку відображатимуться у вікні Поиск. Щоб виконати пошук тих самих ключових слів у наступній пошуковій системі, натисніть кнопку Следующий. Кнопка На- стройка дозволяє задати перелік пошукових систем і послідовність, в якій вони застосову- ватимуться.
Вікно Поиск зберігає також результати десяти попередніх пошуків. Щоб їх перегля- нути, виберіть радіокнопку Предыдущий поиск та знайдіть у списку ключові слова, за якими виконувався цей пошук.