ПРИНЦИПИ ПОШУКУ ІНФОРМАЦІЇ ЗА ДОПОМОГОЮ ІНТЕРНЕТ

"Всесвітня павутина" в Іnternet - це мільйони документів з неструктурованою текстовою інформацією (а також із графікою, аудіо, відео). Інтенсивно розвиваються довідкові служби Іnternet, що допомагають користувачам знайти потрібну інформацію. Їх можна розділити на: універсальні й спеціалізовані.

В універсальних службах використається звичайний принцип пошуку в неструктурованих документах - по ключових словах. Ключовим словом документа називається окреме слово або словосполучення, що відбиває зміст даного документа.

Універсальна служба пошуку (пошукова система) - це комплекс програм і потужних комп'ютерів, що виконують наступні функції.

1) Спеціальна програма (пошуковий робот) безупинно переглядає сторінки "Всесвітньої павутини", вибирає ключові слова й становить базу даних індексів. У базу включаються ключові слова й адреси документів, у яких вони виявлені.

2) Web-сервер приймає від користувача запит на пошук, перетворює його й передає спеціальній програмі - пошуковій машині.

3) Пошукова машина переглядає базу даних індексів, складає список сторінок, що задовольняють умовам запиту, і повертає його Web-серверу.

4) Web-сервер оформляє результати виконання запиту в зручному для користувача виді й передає їх на машину клієнта.

Спеціалізовані довідкові служби - це тематичні каталоги, у яких зібрані структуровані відомості про адреси серверів по тій або іншій тематиці. На відміну від універсальних баз індексів, тематичні каталоги складаються фахівцями й забезпечують клієнта більш достовірною й систематизованою інформацією про мережі.

Багато сайтів Іnternet мають у своєму розпорядженні власні механізми пошуку. В основному це механізм контекстного пошуку. Деякі сторінки в Іnternet спеціально призначені для прийому й обробки запитів на пошук. В основі запитів на пошук і вибірку інформації лежить апарат алгебри логіки. Найпростіший запит - по слову. Якщо запит складається з декількох слів, то передбачені наступні угоди:

1) кілька слів, набраних через пробіл, позначають запит, що відповідає логічної операції OR(АБО);

2) кілька слів, вкладені в лапки, сприймаються системою як єдине ціле (як символьний рядок);

3) слова, з'єднані знаком "+", відповідають логічній операції AND(І).

Найбільш популярні пошукові служби:

· Alta Vіsta (www. Altavіsta.com);

· Іnfoseek (www.іnfoseek.com);

· Yahoo! (www.yahoo.com);

· Rambler (www.rambler.ru);

· Meta (www.meta-ukraіne.com).

ПОНЯТТЯ ГІПЕРТЕКСТОВОГО ДОКУМЕНТА.
WWW-ПОСЛУГА ІНТЕРНЕТ. ПРОГРАМИ-БРАУЗЕРИ

Гіпертекст - звичайний текст із картинками, у якому виділені окремі знаки, слова, фрази або картинки, що називаються полями. З кожним полем у гіпертексті зв'язана певна дія:

· перехід в інше місце того ж гіпертексту;

· перехід в інший гіпертекст;

· програвання звукозапису або відеозапису;

· запуск програми на виконання й т.д.

Якщо встановити курсор на одне з полів і нажати клавішу Enter (або ліву кнопку миші), то виконається дія, пов'язана з обраним полем.

Принципи побудови гіпертекстів широко використаються в Інтернет. Саме комбінація гіпертексту й гипермедиа сприяла поширенню Web.

WWW (World Wіde Web - "Всесвітня павутина") - інтерактивна гіпертекстова інформаційно-пошукова система в Інтернет.

Блоки даних WWW розміщаються на окремих комп'ютерах, що називаються WWW-серверами й належать окремим організаціям або приватним особам. За допомогою гіпертекстових посилань, вбудованих у документи WWW, користувач може переходити від одного документа до іншого.

Web-сторінка - найменший документ "Всесвітньої павутини", що містить текстову, графічну інформацію, а також посилання на інші документи Інтернет.

Сайт - група Web-сторінок, об'єднана однією темою.

В основі WWW лежить протокол передачі гіпертекстових повідомлень HTTP, а самі сторінки формуються за допомогою спеціальної гіпертекстової мови опису документів HTML.

Для роботи з WWW використаються спеціальні програми-клієнти, які називаються browsers (браузери, броузери, навігатори, оглядачі). У нашій країні найбільш популярні оглядачі Netscape Navіgator й Mіcrosoft Іnternet Explorer.

Основний об'єкт обробки додатка Mіcrosoft Іnternet Explorer - ресурс мережі Інтернет, наприклад, - Web-сторінка або каталог FTP. Із цими об'єктами можна робити стандартні операції:

· відкриття й читання сторінки за її адресою, перегляд каталогів;

· пошук сторінок в Інтернет по запиту;

· збереження сторінок, їх друк, копіювання обраних файлів із серверів Інтернет.

В Іnternet Explorer є особлива операція: запуск додатків Іnternet Maіl й Іnternet News, які працюють із електронною поштою й групами новин.