Введение


Интеллектуальные поисковые системы: принцип организации, сравнительный анализ.

Активный рост Всемирной паутины превратил Internet в огромное информационное пространство с разнообразным и зачастую плохо организованным содержимым. Пользователи сталкиваются с быстрым ростом объемов информации, нашедшим отражение в термине «информационная перегрузка». И если для просмотра отдельных Web-страниц достаточно минимального набора навыков, то поиск по запросам и навигация в Web-пространстве требуют большего.

Исследования поискового поведения опытных и начинающих пользователей Сети позволяют сделать несколько практических выводов. В частности, модель поискового поведения может послужить основой для улучшения интерфейсов и расширения функциональности существующих поисковых систем. В будущем они смогут полнее удовлетворять разнообразные потребности, как экспертов, так и новичков. Кроме того, глубокое понимание трудностей, с которыми сталкиваются потребители в процессе поиска, необходимо при построении справочных систем.

Поведение Web-пользователей привлекает к себе внимание исследовательского сообщества. Теза Лоу и Эрик Хорвиц, например, предложили задействовать байесовские сети для моделирования последовательных запросов, с которыми пользователи обращаются к поисковой машине. Эти сети могут дополнить поисковую машину назначенными вручную категориями предполагаемых информационных целей, позволяющими предсказывать модификации запросов. Ингрид Цукерман с коллегами говорят о возможности применять Марковские модели для предугадывания следующего запроса потребителя на основе предыдущих. Однако в этих исследованиях не принимаются во внимание персональные характеристики пользователя и его опыт.

Разумеется, традиционные информационно-поисковые системы, основанные на использовании ключевых слов, могут обеспечить первый шаг в процессе поиска. Однако проблема состоит в том, чтобы выполнять поиск более точно и интеллектуально на основе знаний о пользователе, его намерениях, целях и т.п., чтобы улучшать результаты поиска, обходясь минимумом уточнений.

Наше исследование предполагает, что обратная связь с потребителем при таком общении может сыграть ключевую роль в уменьшении информационной перегрузки и получении искомой информации. Базовая лингвистическая эрудиция сделает поисковую систему более точной благодаря сужению запросов и идентификации намерений пользователя. Соответственно, мы исследуем генерацию интерактивных диалогов на естественном языке для библиографического поиска в Сети с целью улучшения процессов поиска и отбора информации при минимальном взаимодействии с потребителем. Основное внимание в нашем подходе уделяется совершенствованию парадигмы поиска с помощью методов компьютерной лингвистики и применения более подходящего поискового агента.