Організація пошуку інформації в глобальної мережі Internet. Способи збереження Web – сторінок та їх частин. Особливості збереження зображень і звуку.

Пошук інформації в мережі Інтернет ─ це не тільки пошук у web – просторі, але й у інших типах ресурсів мережі.

Основними об’єктами, які можна використовувати при виконанні пошуку, є гіпертекстова система WWW, система телеконференцій, електронна пошта, бази даних, списки розсилки, пошукові системи тощо. Але й після проведення пошуку та отримання результатів потрібен контроль за достовірністю отриманої інформації.

В Internet вже досить давно використовують так звані метапошукові служби. Таки служби не мають власної бази даних, а просто передають запит декільком звичайним пошуковим службам і, після цього, систематизують всі знайдені посилання.

Крім метапошукових систем можна використовувати спеціальні програми пошуковіагенти, які шукають інформацію одночасно по кількох пошукових службах, як і мета пошукові служби. Тобто подають запит одночасно кільком пошуковим машинам, а результати збираються в одне ціле і сортують. Пошукові агенти мають ряд переваг над мета пошуковими службами, серед них :

· опитування одночасно великої кількості пошукових служб, інколи до кількох сотень;

· гнучке керування передаванням запитом з вказанням максимального часу очікування відповіді, кількості одночасно встановлених з’єднань і т.д.;

· можливість збереження результатів пошуку з можливістю обновлення;

· перевірка доступності знайдених посилань і завантаження сторінок для автономного вивчення;

· можливість додаткової перевірки знайдених документів.

Основна перевага пошукових агентів полягає в тому, що всі вище перераховані дій виконуються автоматично, а також в тому, що для обробки посилань та документів завантажуються відразу декілька процесів. За рахунок цього оптимально використовується Internet – канал і затрати часу різко зменшуються.

Пошукові служби відрізняються як за кількісними ( об’єми охоплення, глибина пошуку), так і за якісними( можливості використання логічних запитів, фільтрація результатів) характеристиками.

Умовно пошукові служби можна поділити на дві групи :

1. Пошукові машини (власне пошукові служби) ; З російських пошукових машин можна відзначити Яndex і Rambler.

2. Пошукові каталоги − кожна служба має свою базу даних (каталог) Web- сторінок і пошук здійснює в своїй базі. До найбільш популярних пошукових каталогів відноситься Yahoo! Будь-яка пошукова служба це дуже складний програмно-апаратний комплекс. Для більшості пошукових служб спілкування ведеться англійською мовою, хоча на сьогодні вже немалий процент служб використовує для цього національні мови. Більшість західних пошукових служб не підтримує кирилиці і тому, для пошуку інформації східнослов’янськими мовами їх взагалі використовувати неможливо. Інша велика проблема таких служб ¾ особливості російського і українського словотворення, одне і те ж слово тут може мати дуже багато форм.

Найбільш популярні пошукові служби по серверах країн СНД :

1. Rambler - має систему пошуку помилок в запитах і гнучку форму виведення результатів. Всі матеріали організовані в чітку і зручну для перегляду структуру;

2. Апорт - її перевага : англо - російський та російсько-англійський переклад запитів і результатів пошуку;

3. МЕТА ¾ потужна пошукова служба по українських Internet - ресурсах як на території України, так і за її межами. Дана пошукова служба є повнотекстовою, тобто підтримує крім стандартних можливостей ще й пошук по полях документів, обмеження по даті.

Інформація на Web- сервері зберігається у вигляді так званих Web- сторінок або Web-документів. Web-документ ─ це файл у форматі HTML. Цей формат визначає зовнішній вигляд документа, взаємне розташування текстової, графічної і мультимедійної інформації.

Більшість користувачів Інтернету використовують для зв’язку зі Всесвітньою мережею з’єднання комутованими телефонними каналами за допомогою модему. Оскільки це повільний спосіб зв’язку, то час завантаження графічного зображення в клієнтський браузер має бути якомога меншим. Саме тому два найбільш популярних графічних стандарти ─ це .GIF і .JPEG.

Стандарт GIFвикористовується в документах HTML для відображення так званої бізнес-графіки : діаграм, логотипів, кнопок, розподільних ліній, інших елементів оформлення сторінки. Для розміщення на web-сайті фотографій, репродукцій картин та зображень із великою кількістю кольорів і колірних переходів використовується стандарт JPEG.

Аудіофайли (звукові файли) в Інтернеті, як і графічні, зберігаються з втратою інформації, як правило, у форматі .WAV (.WAV ─ один з типів файлів сімейства RIFF ─ системи зберігання будь-яких структурованих даних.

Як правило, розробники сайтів вказують розмір аудіофайлів, щоб користувач міг оцінити свої можливості по завантаженню даного звукового файлу.

Сучасні браузери також підтримують роботу з відеокліпами популярних форматів .AVI, .VIVO, .QT, .MPEG.