ПРИНЦИПИ ПОШУКУ ІНФОРМАЦІЇ ЗА ДОПОМОГОЮ ІНТЕРНЕТ
"Всесвітня павутина" в Іnternet - це мільйони документів з неструктурованою текстовою інформацією (а також із графікою, аудіо, відео). Інтенсивно розвиваються довідкові служби Іnternet, що допомагають користувачам знайти потрібну інформацію. Їх можна розділити на: універсальні й спеціалізовані.
В універсальних службах використається звичайний принцип пошуку в неструктурованих документах - по ключових словах. Ключовим словом документа називається окреме слово або словосполучення, що відбиває зміст даного документа.
Універсальна служба пошуку (пошукова система) - це комплекс програм і потужних комп'ютерів, що виконують наступні функції.
1) Спеціальна програма (пошуковий робот) безупинно переглядає сторінки "Всесвітньої павутини", вибирає ключові слова й становить базу даних індексів. У базу включаються ключові слова й адреси документів, у яких вони виявлені.
2) Web-сервер приймає від користувача запит на пошук, перетворює його й передає спеціальній програмі - пошуковій машині.
3) Пошукова машина переглядає базу даних індексів, складає список сторінок, що задовольняють умовам запиту, і повертає його Web-серверу.
4) Web-сервер оформляє результати виконання запиту в зручному для користувача виді й передає їх на машину клієнта.
Спеціалізовані довідкові служби - це тематичні каталоги, у яких зібрані структуровані відомості про адреси серверів по тій або іншій тематиці. На відміну від універсальних баз індексів, тематичні каталоги складаються фахівцями й забезпечують клієнта більш достовірною й систематизованою інформацією про мережі.
Багато сайтів Іnternet мають у своєму розпорядженні власні механізми пошуку. В основному це механізм контекстного пошуку. Деякі сторінки в Іnternet спеціально призначені для прийому й обробки запитів на пошук. В основі запитів на пошук і вибірку інформації лежить апарат алгебри логіки. Найпростіший запит - по слову. Якщо запит складається з декількох слів, то передбачені наступні угоди:
1) кілька слів, набраних через пробіл, позначають запит, що відповідає логічної операції OR(АБО);
2) кілька слів, вкладені в лапки, сприймаються системою як єдине ціле (як символьний рядок);
3) слова, з'єднані знаком "+", відповідають логічній операції AND(І).
Найбільш популярні пошукові служби:
· Alta Vіsta (www. Altavіsta.com);
· Іnfoseek (www.іnfoseek.com);
· Yahoo! (www.yahoo.com);
· Rambler (www.rambler.ru);
· Meta (www.meta-ukraіne.com).
ПОНЯТТЯ ГІПЕРТЕКСТОВОГО ДОКУМЕНТА.
WWW-ПОСЛУГА ІНТЕРНЕТ. ПРОГРАМИ-БРАУЗЕРИ
Гіпертекст - звичайний текст із картинками, у якому виділені окремі знаки, слова, фрази або картинки, що називаються полями. З кожним полем у гіпертексті зв'язана певна дія:
· перехід в інше місце того ж гіпертексту;
· перехід в інший гіпертекст;
· програвання звукозапису або відеозапису;
· запуск програми на виконання й т.д.
Якщо встановити курсор на одне з полів і нажати клавішу Enter (або ліву кнопку миші), то виконається дія, пов'язана з обраним полем.
Принципи побудови гіпертекстів широко використаються в Інтернет. Саме комбінація гіпертексту й гипермедиа сприяла поширенню Web.
WWW (World Wіde Web - "Всесвітня павутина") - інтерактивна гіпертекстова інформаційно-пошукова система в Інтернет.
Блоки даних WWW розміщаються на окремих комп'ютерах, що називаються WWW-серверами й належать окремим організаціям або приватним особам. За допомогою гіпертекстових посилань, вбудованих у документи WWW, користувач може переходити від одного документа до іншого.
Web-сторінка - найменший документ "Всесвітньої павутини", що містить текстову, графічну інформацію, а також посилання на інші документи Інтернет.
Сайт - група Web-сторінок, об'єднана однією темою.
В основі WWW лежить протокол передачі гіпертекстових повідомлень HTTP, а самі сторінки формуються за допомогою спеціальної гіпертекстової мови опису документів HTML.
Для роботи з WWW використаються спеціальні програми-клієнти, які називаються browsers (браузери, броузери, навігатори, оглядачі). У нашій країні найбільш популярні оглядачі Netscape Navіgator й Mіcrosoft Іnternet Explorer.
Основний об'єкт обробки додатка Mіcrosoft Іnternet Explorer - ресурс мережі Інтернет, наприклад, - Web-сторінка або каталог FTP. Із цими об'єктами можна робити стандартні операції:
· відкриття й читання сторінки за її адресою, перегляд каталогів;
· пошук сторінок в Інтернет по запиту;
· збереження сторінок, їх друк, копіювання обраних файлів із серверів Інтернет.
В Іnternet Explorer є особлива операція: запуск додатків Іnternet Maіl й Іnternet News, які працюють із електронною поштою й групами новин.