Лекция 8. Основные типы информационно поисковых задач и алгоритмы их решения

Одним из центральных понятий информационной науки и практики является понятие информационной потребности (ИПотр). В самом общем смысле под ИПотр понимается необходимость в информации, требующая удовлетворения и обычно выражаемая в информационном запросе.
Например, планирование дальней поездки формирует ИПотр познакомиться с авиационным расписанием. Такое знакомство может быть выполнено в разной форме - по телефону, непосредственно в билетном агентстве в диалоге со специалистом, путем изучения расписания в напечатанном виде или в результате его поиска во всемирной сети. Однако при всем различии форм удовлетворения ИПотр сама она остается одной и той же.
Заметим, что после того, как выбран нужный рейс и куплен билет, информация утратила свою ценность для нас, не перестав при этом оставаться ценной для других потенциальных потребителей. Это свойство полной потери ценности информации (ее потребительной стоимости) для данного потребителя в данный момент, представляет собой важную особенность ИПотр, существенно отличающую ее от других видов потребностей человека. Одна и та же информация может снова стать предметом потребления, если она будет предъявлена другому потребителю, если перед тем же самым потребителем возникнет другая задача, а также если увеличится запас его знаний, позволяющий распознать в этой информации новые аспекты.


Основы информационного поиска


Основным средством передачи научной информации во времени и пространстве был и продолжает оставаться письменный документ. Возникновение системы научной коммуникации при помощи письменных документов сразу же потребовало организации промежуточных хранилищ, в которых бы последние накапливались и хранились в систематизированном виде. Это давало исследователю возможность производить поиск документов в любое удобное для него время.

Информационным поиском (ИП) называется некоторая последовательность операций, выполняемых с целью отыскания документов, содержащих определенную информацию (с последующей выдачей самих документов или их копий), или с целью выдачи фактических данных, представляющих собой ответы на данные вопросы.

В общем случае процедура ИП состоит из четырех этапов:
• уточнения информационной потребности и формулировки запроса;
• определения совокупности держателей информационных массивов;
• извлечения информации из информационных массивов;
• ознакомления пользователя с полученной информацией и оценки результатов поиска.

Наиболее эффективный метод поиска документов, содержащих научную информацию - прочитать каждый документ некоторой библиотеки. Но такой способ практически неосуществим, поскольку число документов обычно бывает слишком большим, чтобы все их можно было прочитывать при каждом информационном запросе. Поэтому приходится использовать другой, менее эффективный метод, при котором ИП производится не по самим текстам документов, а по кратким характеристикам содержания или определенным внешним признакам документов. Для этого каждый документ снабжается поисковым образом документа (ПОД) - характеристикой, в которой кратко выражается основное смысловое содержание документа.

Простейшим ПОД (поисковым образом документа) является его заглавие. По заглавию книги или статьи читатель в большинстве случаев может судить о том, представляет ли для него интерес эта книга или статья и стоит ли с ней знакомиться подробней. Аннотация и реферат документа также суть его поисковые образы.

Здесь отметим лишь то, что бывают два подхода к сбору материалов. Первый - это стремление собрать его максимально полно, чтобы иметь достаточно фактов, цифровых данных, обобщающих мыслей для полного освещения избранной темы.

Другой подход - собрать минимум материала для освещения темы, чтобы сэкономить время и труд, чтобы выполнить письменное задание с минимальными усилиями.

Выбор подхода - дело индивидуальное.

Если исходных материалов много, то их надо сократить до оптимальных пределов. Скажем, из пяти монографий выберем три, выпишем из них цитаты, цифры, таблицы (оставшиеся две монографии включим в список использованной литературы; ведь мы их просмотрели, пролистали, оценили их полезность). Или из 100 страниц ксерокопии документов оставили самые нужные 15-20. Разрозненные данные сгруппировали, цифровые показатели свели в удобные для чтения таблицы, продумали перечень необходимых иллюстраций.

Все отобранные материалы должны быть на отдельных листах, с записями только на одной стороне, чтобы в дальнейшем их можно было располагать в любой последовательности.

При описании каталогов, картотек и информационных изданий подчеркивалось, насколько важно иметь исчерпывающее представление о всех их видах и стараться использовать их как можно полнее. Однако нельзя понимать это как совет всегда и по любому случаю обращаться ко всем библиографическим источникам одновременно. При их большом количестве и разнообразии дело это совершенно не реальное. Во всех руководствах поэтому рекомендуется выбрать те из них, которые в наибольшей степени соответствовали бы конкретным задачам поиска.

Бессистемный поиск всегда отнимает непомерно много времени и одновременно не дает гарантии его полноты.

Цели и условия поиска документальных источников информации настолько различны, что никакой единой схемы быть не может. Подход к поиску литературы может зависеть оттого, в какой последовательности ее предполагается изучать: в хронологической, когда литературные источники рассматриваются в их прямой хронологической связи, или обратнохронологической, когда знакомятся сначала с новейшими изданиями, а затем уже переходят к более старым по времени публикациям.

Хорошо ориентируясь в библиотечных каталогах, можно без особого труда составить схему поиска документальных источников информации применительно к его конкретным целям.

Обычно выделяются три типа информационно-поисковых задач (запросов), с которыми читатель приходит в библиотеку:

· Адресный – поиск определенного документа, о котором известны некоторые данные (авторы, название и др.);

· Тематический – поиск информации (общей или частной, фундаментальной или актуальной) о предмете исследования в определенном аспекте;

· Фактографический – поиск определенных сведений (фактов) о предмете исследования (объекте, персоне).

Уточнение запросов разных типов может вестись сходными методами, которым библиотекари и педагоги должны научить читателей. Мы выделим три:

· Уточняющие вопросы (читателя – к себе);

· Уточняющая (дифференцирующая) схема;

· Ход «от словаря».

А теперь посмотрим, как эти методы уточнения применяются в различных типах поисковых запросов.

Адресный поиск. С ним дело обстоит проще всего. Запрос фактически уже сформулирован. Его уточнение может сводиться к нескольким вопросам, которые читатель должен уметь задавать самому себе прежде чем приступит собственно к поиску.

1. Точно ли я знаю имя автора и / или название книги (диска, кассеты, другого документа)?

2. Если мне известны и имя, и фамилия автора, что я буду в первую очередь учитывать при поиске?

3. Правильно ли я их записал? Как еще они могут писаться?

4. Может ли быть другой вариант названия?

5. Что еще мне известно об этом документе (жанр, год выпуска и т.п.)?

6. Может ли искомое произведение оказаться частью документа (сборника, например), а не отдельным документом (изданием)?

Можно, конечно, просто дать студентам такой список вопросов и потом на практике проверять их усвоение. Но это не будет настоящим обучением, ибо, как известно, при любом объяснении на словах и даже на примере (делай, как я) человек усваивает лишь часть информации, к тому же – меньшую. Лучшее обучение то, где информация, правила, закономерности выведены самостоятельно (при поддержке учителя, конечно) в результате исследования, а не повторения. Так и с этими вопросами.

Предложите ученикам выполнить несколько заведомо неточных адресных запросов. Найти, например, рассказы, которых у вас в фонде на самом деле точно нет отдельным изданием; рассмотреть или поискать издания с различным написанием заглавий или фамилий авторов (переводных, например), – и вы увидите как легко ученики, при хорошей организации занятия, сами выведут все уточняющие вопросы. После этого их можно вынести на большой плакат (пусть ребята сами и пишут – как умеют!) и разместить на видном месте в библиотеке.

Любая работа идет на занятиях с большим интересом, а эффективность освоения новых знаний выше в том случае, если задание дает реальный продукт, нужный не только этим ученикам.

Тематический поиск. Это тот тип запроса, с которым библиотекарь сталкивается чаще других, читателю же формулировать его – труднее всего.

Если студент пришел в библиотеку с заданием сделать в классе доклад о зубрах, то вопрос «Что именно он хочет узнать об этом животном?» может поставить его в тупик: порой ведь студент не очень понимает, что стоит за таким вопросом и теряется от этого непонимания. Есть несколько вариантов уточнения этого запроса.

Работа «от словаря»

Это тот случай, когда речь идет не о сужении круга поиска путем уточнения темы, а о расширении его. Так бывает, когда студенту нужно найти ответ на вопрос, о котором он не имеет ни малейшего понятия. В таком случае уточнение запроса начинается с уточнения значения слова или сферы его применения. От того, что найдено в первом источнике, зависит движение к следующему, а следовательно, расширение представления о теме и определение того, что именно нужно в итоге.

Фактографический поиск.Этот вид информационного запроса, как показывает практика, в библиотеке чаще встречается не как самостоятельный, а как сопутствующий запросу тематическому. Обычно он не требует этапа уточнения, так как исходный вопрос сам по себе содержит уточнение, поскольку начинается со слов кто, что, где, когда, откуда, сколько и т.п. Однако бывает, что читателю приходится искать фактографические сведения различного характера для сравнения, и тогда проблема уточнения запроса возникает.

 

Выработка алгоритма поиска и его корректировка

«Разве можно вырабатывать алгоритм поиска, если алгоритм – это уже набор правил и порядок действий, а значит – он всегда должен быть один?» Конечно, вопрос не часто встречающийся, но все же с этого и начнем – с терминологии.

Алгоритм – совокупность действий и правил для решения данной задачи. (С.И. Ожегов, Н.Ю. Шведова. Толковый словарь русского языка. М., 1993.)

Как мы видим, данное определение не противоречит идее вырабатывать алгоритм поиска информации по конкретному запросу: раз запросы (то есть поисковые задачи) разные, то и пути решения должны быть разными. И, разумеется, эти пути нужно продумывать прежде, чем бросаться решать задачу. Если решение поисковой задачи требует нескольких шагов, то их последовательное планирование и есть выработка общего алгоритма поиска информации, внутри которого укладываются существующие стандартные наборы действий (алгоритмы), например, по поиску в алфавитном или систематическом каталогам, в словарях.

Конечно, для того, чтобы выработать алгоритм (то есть логическую последовательность действий) поиска информации по конкретному запросу, ученик должен иметь представление о существующих возможностях и правилах поиска. Иначе говоря, алгоритмам работы с различными видами каталогов и картотек, со словарями и СБА различных изданий надо учить либо до, либо одновременно с освоением всех этапов работы с информацией.

После того, как запрос максимально уточнен, не спешите искать информацию. Начинаем мы с того, что подбираем все возможные ключевые слова, обозначающие наш круг поиска. Они должны максимально подробно отражать смысл нашего поискового запроса. Не нужно забывать и о том, чтобы подбирать синонимический ряд к основным словам. Ведь может оказаться, что тезаурус электронного каталога, например, «не знает» одного слова, но «знает» его синонимы, а в случае поиска по первому варианту может выдать отрицательный результат. Ключевые слова важны не только для тех, кто будет работать с электронным каталогом и с Интернетом, но и для традиционного поиска. Как же иначе вести поиск в АПУ систематического каталога или энциклопедии? При этом ключевыми можно с некоторой долей условности называть не только собственно поисковые слова, т.е. предмет поиска: в такой список полезно включать и те, которые будут просто дополнительной «шпаргалкой» при поиске и отборе информации. (Об этом мы еще вспомним чуть ниже).

Иногда ключевых слов будет всего несколько. В Интернете же, безусловно, ключевые слова должны быть как можно более точными, и при этом хорошо еще уметь указывать дополнительные параметры поиска (например, учитывать ли все слова отдельно или только словосочетание, искать ли только в новостях или только в словарях и т. д.)

То, о чем говорилось в двух предыдущих абзацах, по сути уже является первым этапом выстраивания алгоритма поиска информации. Повторимся: он состоит из подбора ключевых слов и синонимического ряда и выстраивания их в логические цепочки, отражающие те или иные связи между понятиями.

Второй этап данной работы – определение всего порядка действий по поиску требуемой информации. Попросту говоря, порядок этот образуется из вопросов «С чего начать?» и «Что делать дальше, если найдем/не найдем достаточно информации с первого, второго и т.д. шага?».

Очередная задача – научить читателей уже на первом этапе поиска локализовывать получаемую информацию, чтобы в ней не «утонуть». Собственно термин локализация и означает ограничение какими-либо пределами, сосредоточение на чем-нибудь одном или в одном месте. Иными словами, надо научить читателя сразу ограничивать, отсеивать некоторые источники и/или информацию как не соответствующую запросу.

Оценка документальных источников информации включает в себя такие критерии, как полнота и достоверность данных, сроки их опубликования, наличие теоретических обобщений и критических материалов, реальность их получения.

Ведь даже при элементарном умении читать каталожную карточку можно сразу отсеять часть материалов как неподходящих, если обращать внимание на подзаголовки, годы издания, читательский адрес, аннотации. (Условно говоря, не берем компакт-диски, видеокассеты и фотоальбомы, если нужен только текст. Или: не годятся книги до такого-то года издания).

Необходимо также уточнить, насколько подробная или, наоборот, общая информация нужна для конкретной работы, и соответственно отсеивать сразу подробную статистику (при подготовке общей информации) или философские статьи по поводу рассматриваемого вопроса, когда требуется сравнительный анализ конкретных показателей.

Так же важно сразу отсеивать те источники, которые слишком просты или слишком сложны для данного читателя.

При небольшой тренировке на практике все это оказывается совсем не так сложно, как может показаться. Умение сосредоточиться на поиске по конкретным параметрам и не позволять себе отвлекаться на ненужную в данный момент информацию – один из показателей общего умения учиться.

Попробуем разобраться, что значит оценивать информацию и по каким параметрам это можно делать.

Достоверность.Это основное требование к любой информации. Не всегда достаточно получить сведения из энциклопедии или словаря (даже, как говорится, «с именем», то есть очень популярных), чтобы быть уверенными в их достоверности.

Есть несколько простых правил, которых придерживаются люди, постоянно (по роду работы, например) имеющие дело с разной информацией. Этим правилам очень полезно учить студентов.

Правило трех источников. Факт считается достоверным, если его подтверждают несколько (больше двух) разных источников.

Степень доверия. Доверие к информации тем выше, чем более мы уверены в квалификации и осведомленности автора.

Иначе говоря, рассматривая новую статью (например, о неких исторических событиях), стоит выяснить, кто ее автор – ученый-исследователь, популяризатор науки или репортер газеты, известной любовью к сенсациям.

Цели и задачи материала. Как они представлены его создателями. Пример. Выпущен новый справочник, авторы которого заявляют в предисловии, что собрали исчерпывающий материал по данному вопросу. В популярной книге на ту же тему доказывается новая теория или трактовка вопроса. Какова степень достоверности сведений в том или другом случае? В первом случае она выше, потому что, скорее всего, авторы собрали и систематизировали сведения из многих источников. Во втором же случае нужно внимательно смотреть не только на факты, но и на то, как они поданы: бывает, что автор, увлеченный своей идеей, начинает «притягивать за уши» какие-то данные, которые помогают в доказательстве, или опускать детали, которые мешают. В таких материалах не всегда легко разобраться и взрослому, но обсуждать подобные ситуации со студентами все равно надо.