Ефективна організація пошуку. На завершення декілька порад щодо користування пошуковими системами.

Перегляд результатів пошуку. Найперше, на що слід звернути увагу, аналізуючи результати пошуку, – це дані про кількість знайдених сайтів і документів, що відповідають умовам пошуку. Якщо ця кількість виявляється занадто великою, то, очевидно, слід задати більш детальні критерії пошуку, щоб відібрати саме ту інформацію, яка найбільш точно відповідає нашим потребам.

Складні запити і розширений пошук. Складні запити застосовують, коли пошук за одним чи декількома ключовими словами не дає бажаного наслідку, бо кількість знайдених документів залишається непомірно великою. На жаль, загальних стандартів побудови складних запитів не існує, і кожна пошукова система має свої особливості, детально ознайомитись з якими можна на її сайті, скориставшись сторінкою допомоги.

У табл. 2.1.2 наводяться приклади найбільш вживаних логічних функцій, що застосовуються у складних запитах пошукових систем, зазначених у табл. 2. Користуючись ними, можна будувати більш складні вирази, враховуючи пріоритетність виконання логічних операцій НЕ, І, АБО: в першу чергу виконуються операція НЕ (NOT, !), потім І (AND, &, +), в останню чергу – АБО (OR, | ). Щоб виконати ці операції в іншій послідовності, застосовують дужки, наприклад у пошуковій системі Rambler запит джем OR (фрукти NOT (яблука OR груші)) забезпечує пошук сторінок, де є слово фрукти, але нема слів яблука чи груші, також будуть знайдені сторінки, де є слово джем.

Таблиця 2.1.2

Знайти сторінки, що містять: Запит Мета Rambler Яndex Апорт AltaVista Yahoo Lycos Hotbot
і слово a, і слово b а b · · · · · ·    
а + b ·     ·     ·  
+а +b     ·   · · ·  
а AND b   ·   · ·     ·
а & b   · ·   ·      
слово a, але не містять слова b ab ·              
а –b     ·   · · ·  
а ~ b     ·          
а NOT b   ·     ·     ·
а & !b   ·            
або слово a, або слово b а | b · · · · ·      
а OR b   ·   · ·      
слово а (точна цитата) а · ·     · · · ·
    ·          
слово, що починається з а а*       · · ·    
слова a і b в межах фрагменту, що складається з n слів [n, a b] ·              
‘(n, a b)’   ·            
слn(a b)       ·        
a /(n-1)b     ·          
a і b в не далі ніж за 10 слів а NEAR b         ·      
слово a в назві документу title(а) ·              
t:a           ·    
слово a в одному з заголовків heading(а) ·              
слово a в адресі URL u:a           ·    

 

Писати подібні вирази безпосередньо у полі пошуку не дуже зручно. У якійсь мірі спростити цю роботу можна, викликавши сторінку розширеного пошуку (advanced search), що є майже у кожній пошуковій системі. Наприклад, у системі Lycos можна ввести декілька слів у поле пошуку а потім вибрати у розташованому нижче списку All Words (AND match) (усі слова) або Any Words (OR match) (якесь із слів) чи Exact phrase (quoted query) (точна цитата), що заміняє застосування AND, OR та “...” відповідно. Крім цього на сторінці розширеного пошуку можна задати багато інших параметрів зокрема:

· Де саме шукати вказані ключові слова? Можливі варіанти вибору: у всьому документі, в його назві, заголовку чи основному тексті, у підписах до малюнків чи назвах музичних файлів; серед сайтів, що є результатами попереднього пошуку; у сайтах, написаних вибраною мовою; у сайтах певного призначення, наприклад сайтах новин, товарів тощо, або навіть у цілком конкретному сайті чи його папках.

· Чи слід обмежувати максимальну відстань між ключовими словами у тексті? Якщо так, то як саме?

· Чи є обмеження на час створення розшукуваних документів? Якщо так, то у якому діапазоні дат виконується пошук?

· В якому вигляді слід виводити знайдену інформацію? Тільки назва документа чи певний фрагмент з уривком тексту. Яка величина фрагменту?

· В якому порядку і якими порціями виводити інформацію про знайдені документи? Відсортованими за датою їх створення (спочатку новіші чи навпаки), за релевантністю, тобто мірою відповідності критеріям пошуку тощо.

Результати пошуку виводяться сторінками. Кожна з них містить інформацію приблизно про 10-15 знайдених документів. Для переходу до наступної чи попередньої сторінки треба натиснути кнопку з посиланням на відповідний номер сторінки: 1 2 3 4 чи діапазон номерів документів: 1-10 11-20 21-30 31-35. Сторінка, на якій ви зараз знаходитесь, (в нашому прикладі – це 2 чи 11-20) не містить посилання на саму себе. По краях списку можна знайти також символи подібні до >>> чи <<<, що означають продовження пошуку і перехід до сторінки, де будуть посилання на наступну групу сторінок, наприклад: 5 6 7 8, та повернення до сторінки з посиланнями на групу сторінок, що переглядалися раніше.

Нагадаємо, що інформація про знайдені документи може виводитись у короткій (тільки назва документу) чи більш деталізованій формі (з невеликим уривком його основного тексту). При значній кількості знайдених документів має значення, у якій саме послідовності вони виводитимуться: спочатку новіші документи чи ті, що точніше відповідають умова пошуку тощо. Всі ці й деякі інші параметри задаються на сторінці Розширений пошук.

Знайшовши сторінку в Інтернеті, часто буває необхідно віднайти на ній потрібний текст. Для цього можна скористатися опцією Найти на этой странице… у меню Правка або комбінацією клавішів Ctrl+F.

· Включіть посилання на пошукові системи, якими ви часто користуєтесь, до складу папки Избранное, панелі інструментів Ссылки, або навіть встановіть на панелі інструментів вашого веб-броузера поле для введення ключових слів (як це зробити, пояснюється на сайтах відповідних пошукових систем).

· Пишіть ключові слова з великої літери тільки тоді, коли це власні імена. Наприклад ключове слово лебідь, дозволяє знайти і лебідь, і Лебідь, і ЛЕБІДЬ, тоді як за ключовим словом Лебідь можна знайти лише слова, що також написані з великої літери.

· Завжди намагайтесь віднайти такі ключові слова, які з найбільшою ймовірністю зустрічаються у потрібній вам інформації і з найменшою – поза нею. Не забувайте й про використання каталогів.

· Уникайте невиправданого вживання стоп-слів. Наприклад у запиті що таке релевантність слова що і таке є зайвими. Такі слова зустрічаються практично у будь-якому тексті, тому пошукові не сприяють. Якщо, наприклад, залишити у запиті тільки релевантність, то одержимо список сторінок, в більшості з яких цей термін зустрічається, але не пояснюється. Для вирішення проблеми можна спробувати пошукати точну цитату “релевантністю називається” або “релевантність – це”, хоча слово це також є стоп-словом, як і слова що, таке.

Не буде зайвим перевірити орфографію ключових слів перш ніж скористатися ними для пошуку, бо, допустивши oпечатку в ключовому слові, ви не просто не знайдете потрібної інформації, а й помилково вважатимете, що її там нема.

Сервіс передачі файлів FTP (File Transfer Protocol) – це один з найстаріших сервісів Інтернет, що з’явився багато раніше світової павутини World Wide Web. На прикладі цього сервісу добре видно як розвивається сучасний Інтернет, і як WWW підміняє собою або поглинає інші сервіси. Щодо FTP, то тут має місце саме поглинання, бо для роботи з FTP можуть використовуватися ті ж броузери, що і для WWW, зокрема Internet Explorer. Працюючи з Internet Explorer і клацнувши черговий раз на якомусь посиланні, ви можете навіть не помітити, як в рядку адреси префікс протоколу http:// змінився на ftp://, отже ви перейшли від сервісу WWW до сервісу FTP.

Сервіс FTP дозволяє отримати через мережу Інтернет доступ до файлів, які зберігаються на серверах, що називаються FTP-вузлами чи FTP-серверами. Якщо в рядку адреси вашого броузера набрати адресу такого вузла, наприклад ftp.microsoft.com [2] (адресу FTP-вузла фірми Microsoft), то на екрані відобразяться файли і папки, що зберігаються на цьому вузлі.

Робота з файлами і папками FTP-вузла мало чим відрізняється від роботи з файлами і папками, розташованими на вашому комп'ютері. Так двічі клацнувши по зображенню якоїсь папки, наприклад services, ми ввійдемо у цю папку і побачимо на екрані файли і папки, що в ній розташовані, а в рядку адреси – адресу даної папки: ftp://ftp.microsoft.com/services/.

Обмеження на роботу з файлами FTP-вузла перш за все визначаються правами доступу, які ви маєте. Так, без спеціального дозволу адміністрації даного вузла ви зможете лише переглядати файли та копіювати їх на свій комп'ютер. Права повного доступу до певних папок вузла дозволять вам розміщувати там свої файли, вилучати чи перейменовувати їх. Щоб увійти на вузол з такими правами, треба ввести своє реєстраційне ім’я і пароль, наприклад набрати у рядку адреси ftp://ім’я_користувача:пароль@ftp.microsoft.com/services/. Деякі вузли потребують введення паролю навіть для перегляду чи копіювання файлів.

Інші обмеження на роботу з файлами FTP-вузла є чисто технічними. Наприклад, зазвичай ви не можете перетягти мишкою іконку файла з папки FTP-вузла в папку вашого комп'ютера. Для копіювання файла, папки чи групи виділених файлів і папок треба клацнути по них правою клавішею мишки і вибрати в контекстному меню опцію Копировать в папку... В деяких випадках не можна відразу відкрити файл, що знаходиться на FTP-вузлі. Його треба спочатку скопіювати на ваш комп'ютер і лише потім відкрити. Навіть якщо ви маєте відповідні права доступу, ви не можете напряму копіювати файли з одного FTP-вузла на інший. Це можна зробити тільки через ваш комп'ютер.

Отже робота з FTP-вузлами зводиться в основному до обміну файлами між FTP-вузлом і вашим комп'ютером. Як відомо, для копіювання, переміщення, перейменування та вилучення файлів, відображення списку файлів в зручному для сприйняття вигляді тощо застосовуються програми, що називаються файл-менеджерами. Багато з них дозволяють виконувати цю роботу не лише з файлами і папками, розташованими на вашому комп'ютері, а й з файлами і папками, розташованими на FTP-вузлах. Наприклад, якщо в програмі Windows Commander вибрати в меню Команды опцію Новое FTP-соединение…, а потім вказати адресу FTP-вузла, то на одній з панелей програми відобразиться список файлів і папок, що розташовані на цьому вузлі. Подальша робота з програмою нічим не відрізняється від добре відомих вам процедур роботи з файлами в програмах Windows Commander, Norton Commander тощо, звісно, з врахуванням обмежень, що випливають з прав доступу до файлів і папок FTP-вузла.

Для пошуку файлів, розміщених на FTP-вузлах, використовуються спеціальні пошукові системи, наприклад база даних сайту www.ftpsearch.lycos.com містить інформацію про 100 млн. файлів на FTP-вузлах усього світу. Перелік популярних пошукових систем для FTP подано у табл. 4. Адреси деяких FTP-вузлів, які ви можете переглянути при виконанні даної роботи – у табл. 5.

Подібно до пошукових систем сервісу World Wide Web, вони також можуть мати каталоги і індекси.

В каталогах інформація впорядкована за функціональним призначенням файлів: драйвери, ігри, музичні файли в форматі МР3, фотографії, різноманітні утиліти, антивірусні програми тощо. Каталоги можуть поділятися на більш детальні підкаталоги і т.д.

Індекси дозволяють шукати файли за їх іменами чи фрагментами тексту, що зустрічається в іменах файлів. Для пошуку можна також користуватися шаблонами * і ?. Нагадаємо, що символом * в шаблоні позначають довільну кількість довільних символів, а символом ? – один довільний символ. Наприклад, задавши шаблон pro*t.exe, ми одержимо список файлів, імена яких починаються літерами pro, закінчуються літерою t і мають розширення exe, наприклад: prompt.exe, project.exe, prospect.exe і т.п.

Якщо ви оберете розширений пошук, то зможете задати ще й додаткові параметри пошуку, наприклад обмеження на розмір файлу тощо.

Деякі пошукові системи крім файлів програм знаходять додаткову пов’язану з ними інформацію, наприклад адреси сайтів їх розробників тощо. Тобто, подібно до того, як в Інтернеті поєднуються сервіси WWW і FTP, так і в цих пошукових системах поєднуються можливості пошуку в обох сервісах.

Порівнюючи можливості сервісів WWW і FTP для пошуку і завантаження файлів, зазначимо, що, коли ім’я потрібного файла вам відоме, то пошукові системи FTP дозволять вам досягти своєї мети швидше. Застосування пошукових систем WWW також дає змогу розшукати сайт, звідки можна завантажити потрібну програму, проте більшість знайдених сайтів будуть такими, де про цю програму можна тільки прочитати, але не завантажити її, навіть, якщо крім імені файла серед ключових слів ви вкажете ще й слово download (завантаження).

Інша річ, коли ім’я файла вам точно не відоме. Якщо ви заходите на FTP-вузол і не бачите нічого, крім імен папок і файлів, які самі по собі мало про що вам говорять, то у вас виникає справедливе бажання краще мати справу з веб-сторінками, де були б якісь пояснення щодо змісту і призначення даних файлів.

 

Таблиця 2.1.3.