Пошук інформації в Інтернет

 

Пошукові служби надають можливість виконувати пошук у базах даних Internet. Пошук ведеться шляхом пошуку відповідності між заданими користувачем ключовими словами і вмістом Web-сторінок, повідомлень груп новин, файлів FTP-серверів і інших ресурсів Internet. Пошукова служба повертає список вузлів (звичайно порціями по 10 або 20 вузлів), причому першими будуть повернуті вузли з найвищою можливістю відповідності сформульованому критерію.

3.1 Критерії пошуку

Практично всі пошукові служби використовують для створення запитів той самий синтаксис. За допомогою знаків "плюс" (+) і "мінус" (-) можна визначити наявність або відсутність визначеного слова на шуканій Web-сторінці або в статті. Більшість пошукових служб також підтримує логічні (бульові) вираження, що визначають комбінацію слів при завданні критерію.

Нижче приведені приклади слів, фраз і параметрів, що можна використовувати при роботі з будь-який описаної в цій главі пошукової служби.

 

"Іванов Іван " Зазначені в лапках слова будуть оброблені, як одна фраза (буде виконуватися пошук усіх слів, розташованих у заданій послідовності). Одні пошукові служби дошкульні до регістра, інші ні
+bus ­-computer У даному випадку буде знайдена сторінка, у якій міститься слово bus і відсутнє слово computer
Монітор AND (Samsung OR Sony) Критерій пошуку інформації, у котрої обов'язково згадується слово Monitor і є присутнім слово Samsung або Sony. Два останніх слова не можуть бути присутнім одночасно
маркет* Деякі пошукові служби дозволяють використовувати зірочку (*) у якості універсального символу. Наприклад, критерій маркет* відповідає пошуку слів маркетинг, маркетолог

 

Ніж докладніше сформульований критерій пошуку, тим ширше буде список повернутих результатів. Конкретизуйте критерій пошуку, додавши по можливості декілька слів. Деякі пошукові служби потребують поділу виражень критерію коми або словом AND.

 


Без пошукових служб задача пошуку конкретної інформації в просторі Web була б практично нездійсненною.

На серверах пошукових служб виконується спеціальна програма, названа роботом (robot). .Іноді такі програми називають павуками (spider) або гусеницями (crawler). Робот збирає інформацію про вміст Web, повертаючи на свій сервер усі виявлені сторінки. Накопичена інформація індексується таким чином, щоб усе слово (за винятком поширених слів типу is або as) могли використовуватися при опрацюванні запиту від потенційного користувача.

При звертанні до пошукової служби користувач потрапляє на початкову сторінку, що дозволяє формулювати критерій пошуку і задавати оператори, що визначають параметри пошуку. Іноді оператори можуть бути задані за допомогою команд меню і кнопок. У інших випадках припадає вказувати їх прямо в рядку критерію пошуку. У цьому розділі описані деякі популярні пошукові служби.