Концепт запиту користувача

Ключова фраза

Розмовляючи, ми використовуємо безліч стійких, словосполучень. Творці Веб-сторінок користуються такими ж сполученнями слів у своїх документах і тому, запит з використанням стійких фраз і словосполучень, що відносяться до теми пошуку — один з могутніх способів швидко одержати добротну добірку результатів.

Для пошуку в подібних випадках, потрібно використовувати лапки (дужки) чи оператори відстані. Іншими словами, потрібно шукати не слова, а словосполучення. Наприклад, згідно запиту „Век живи”, МЕТА з великою точністю видасть сторінки, де міститься прислів’я „Век живи — век учись” та його варіації, при цьому в короткій анотації буде підсвічена саме ключова фраза. Запити по фразі „Комп’ютерна периферія”, „курс валют”, „прайс-лист” і т. ін. значно скорочують загальне число знайдених документів і дозволяють уточнити пошук.

В найзагальнішому вигляді концепт — це зміст, що вкладається в запит. Питання в тім, яким чином передати те, що користувач хоче відшукати в ключових словах запиту? Можна спробувати знайти інформацію в лоб — і просто ввести ключові слова, що відповідають запиту. Як правило, цього досить. Якщо ж результатів пошуку немає чи вони не зовсім точні, то потрібно спробувати переформулювати запит (тобто використовувати інші ключові слова, синоніми, що відповідають змісту пошуку).

Можливий та інший підхід. Документи, що містять інформацію, яка є цікавою, можуть не бути присутніми в індексі МЕТИ, однак, те, що вони є десь в українському Інтернеті — більш ймовірно. Залишається тільки добратися до них, використовуючи більш загальні за змістом категорії, що включають ключові слова. Наприклад, якщо користувачу потрібний конкретний український закон, то краще шукати сервера, присвяченого українському законодавству, якщо ж поштова адреса якої-небудь організації — краще спробувати знайти „Жовті сторінки” і т. ін.

3.28. Інформаційно-пошукова система InfoRes

INFORES-XL5 (Information Retrieval System-Extended-Landuage) представляє собою інформаційно-пошукову систему, орієнтовану на обробку повнотекстових і реферативних документів. Архітектура InfoReS-XL дозволяє проводити швидкий інтерактивний пошук інформації в базах даних великих обсягів.

Як і більшість подібних систем, InfoReS-XL має засоби для:

- створення і ведення документальних баз даних;

- підготовки запитів і пошуку в базах даних;

- забезпечення аутентификации й авторизації користувачів на рівні баз даних та їхніх полів;

- одержання результатів у форматі, що задається користувачем.

InfoReS-XL дозволяє накопичувати великі обсяги інформації і здійснювати швидкий доступ до документальних даних найрізноманітніших форматів, структур і призначень.

Особливості формування запитів у режимі пошуку системи InfoReS-XL

Запити системи пошуку складаються з операндів (пошукових термінів чи їх правих усікань) і операторів. Запит вводиться в область введення тексту і передається пошуковій системі натисканням кнопки „Найти”. Пошук ведеться в базі даних, обраній користувачем (де користувач шукає).

У якості операндів можуть використовуватися пошукові терміни природної мови чи їх праві усікання, довжина яких перевищує 2 літери. Система не чутлива до регістрів букв.

Використовується такий набір операторів, розташованих відповідно до встановлених пріоритетів:

NOT (AND NOT) — логічне НІ, що розуміється як НЕМАЄ;

AND — логічне І;

OR — логічне ЧИ;

ADJUST — оператор контекстної близькості.

Оператор контекстної близькості відбирає пари пошукових термінів, що у тексті документа розташовуються один від одного не більше ніж на два слова, причому враховується порядок проходження термінів. При вживанні операторів допускається використання синонімічних рядів:

NOT: «!», «%, «NOT»,«HE»;

AND: «&», « » (пробіл), « + », «AND», «I»;

OR: « », «,», «;», «OR», «ЧИ»;

ADJUST:«-»,« ADJ », « NEAR », « БІЛЯ ».

Запит може бути багаторівневим. Різні рівні або визначаються пріоритетами операторів, що до нього входять, або фіксуються за допомогою круглих дужок.

Приклад запиту (російською мовою) (кофе или какао) ! (молот OR зерн) -Нраствор

Такому запиту задовольняють документи, у яких присутній термін „растворимый(-ое і т. ін.)”, а також або термін „кофе”, або термін „какао”, або обоє разом, але при цьому і терміни „молотый (-ое і т. д.)” і „зерна(-ах і т. д.)”.

3.29. Інформаційно-пошукова система ASearch

ASEARCH6 — це повнотекстова інформаційно-пошукова система, що працює з українським сегментом Інтернету, пошук ведеться на одній із трьох мов — українській, російській чи англійській.

Пошук ведеться без врахування регістрів, тобто запроси „Україна” і „україна” — ідентичні, але з урахуванням морфології української і російської мов. Звичайно, запит являє собою одне або кілька слів, наприклад: „пошукові системи Інтернету”. Відповідно до такого запиту, знаходяться документи, у яких зустрічаються всі слова запиту. Є, щоправда, обмежене число слів (сполучники, прийменники і т. ін.), що у запиті ігноруються, тому що не несуть самі по собі змістовного навантаження. Наприклад, відповідно до запиту: „закон і документ”, будуть знайдені всі документи, у яких зустрічаються обидва слова „закон” і „документ”, сполучник та ігнорується, тому приведений вище запит можна записати й так: „закон документ”. Результат пошуку буде такий же.

Пошук ведеться з урахуванням граматичної форми — це означає, що слова „закон”, „законом”, „законний” — різні слова. Якщо вам потрібно знайти всі слова, що починаються з „закон”, скористайтеся оператором «*» (зірочка). Наприклад, якщо необхідно знайти документи, що стосуються діяльності президента України, то потрібно скористатися запитом: „президент* і Україн*”.

Можна обмежити область пошуку, тобто робити пошук не по всій базі, а по конкретному сайту чи групі сайтів. Наприклад, відповідно до запиту: „закони і urlQ”, будуть знайдені всі документи на сервері rada.kiev.ua, що містять слово закони.

Простий пошук дозволяє виконувати запити до бази ASearch з можливістю обмеження пошуку однією або декількома рубриками. Для виконання пошуку по рубриці просто потрібно поставити галочку біля назви рубрики. Для виконання пошуку по всій базі — забрати позначки з усіх рубрик.

Після того, як виконаний пошук і отриманий результат, кількість знайдених документів може виявитися занадто великою. У цьому випадку можна скористатися можливістю „пошуку в знайденому”. Для того, щоб це зробити досить у рядку запиту написати новий запит, і поставити галочку в поле — „шукати в знайденому”.