Адаптивный поисковый агент

В отличие от традиционных поисковых машин или информационно-поисковых систем разработанный нами поисковый агент не доставляет пользователю сразу всю информацию, полученную в результате поиска в Web. Сначала агент накапливает знания о реакции пользователя, целях и т.д., что положительно влияет на снижение уровня информационной перегрузки. В ходе взаимодействия агент уточняет запросы и фильтрует исходную информацию, полученную от пользователя в процессе поиска, пока не сможет отобрать разумное количество сведений.

Генератор естественного языка использует полученные агентом результаты, чтобы синтезировать адаптивные высказывания, соответствующие текущим ограничениям и состоянию беседы. В данном случае термин «критерии» означает основообразующее представление для документов и профиля пользователя. Они подобны критериям, используемым в информационно-поисковых системах, но дополнены специальными векторными функциями для поддержки необходимой выразительности.

Документы и запросы пользователя представлены в многомерном пространстве. После их обработки процессором естественного языка они преобразуются в шаблон, определяющий вектор критериев. Поисковый агент использует метрику расстояния и некоторые существующие машины, чтобы найти соответствующие документы.

На Рис.4 показана общая стратегия выбора следующего действия, основанная на уровнях уверенности.

 

Рис.4 Стратегия генерации действия. Алгоритм описывает стратегию выбора следующего вероятного действия поискового агента, основанную на реакции пользователя и предыдущих уточнениях результатов поиска

 

Фактически, генератор естественного языка преобразует эти действия в высокоуровневые прагматические ограничения, которые заставляют агента генерировать определенный вид диалога на естественном языке.

Основные выводы

Опытная система позволила сделать два главных вывода:

  • беседа на естественном языке с автоматической системой в ходе поиска вполне возможна;
  • такое взаимодействие уменьшает информационную перегрузку и, таким образом, время, которое пользователи тратят на поиск.

Для реализации дискурса генератор диалога использует структуру семантической сети, которая обеспечивает средства обслуживания естественного языка и формы представления знаний в виде семантической сети. Анализ результатов базировался на генерации 1 тыс. образцов структуры диалога, полученных от выполняемой системой задачи обработки дискурса (исходные диалоги велись по-испански).

Производительность системы была проанализирована с точки зрения фильтрации, чтобы оценить число коммуникативных шагов, необходимое для уточнения требований и получения отфильтрованной информации. Первоначально набор возможных документов включал в себя более 30 тыс. ссылок, но потом область поиска была сужена и составила менее 1 тыс. ссылок. Были проведены два эксперимента (Рис.5), в одном из которых искали информацию по тематике Java, а во втором — мультфильмы.

 

Рис.5 Интерактивные эксперименты: a) взаимодействия в диалоге по тематике Java показали рост числа подходящих документов более чем за три обмена; б) даже в диалогах с тремя обменами наблюдались внезапные приращения от одной почти до 35 ссылок

 

Каждое взаимодействие состояло из одного или нескольких диалогов (обменов) между пользователем и системой.

Взаимодействия в диалоге по Java показали рост числа подходящих документов более чем за три обмена (рис. 5а). Это не случайно: и контекст, и вид вопросов изменяются в зависимости от ситуации и содержания документа. Схожие результаты были получены и во втором эксперименте (рис. 5б). Даже в диалогах с тремя обменами наблюдались внезапные приращения от одной до почти 35 ссылок. Это связано с тем, что агент пришел к определенным выводам, но пользователь наложил ограничение, связанное с характером документа.

Экспериментальная проверка влияния обратной связи с пользователем на способность поискового агента делать выводы показывает, что взвешенные функции поиска информации в зависимости от ее важности или полезности помогают сэкономить время. В любом случае взаимодействия (их форма и содержание) существенным образом зависят от этих факторов. Однако следует учитывать вклад пользователя в решения, принимаемые системой. Несмотря на умеренную сложность экспериментов и ограниченность времени их проведения, идентифицированные в нашем исследовании проблемы не должны радикально измениться при расширении требований к реализации (например, разные языки, возможности поиска и т.д.).

Использование модели диалогового взаимодействия кажется многообещающей стратегией. Она позволяет справиться с более специфическими требованиями к поиску информации, в которых проектирование и реализация системы NLG могут быть легко адаптированы к особым коммуникативным ситуациям. В отличие от других подходов, подразумевающих использование NLP для решения сходных проблем, наша модель идентифицирует интересы и цели потребителя в ходе интерактивного диалога. В иных подходах предпринимается попытка заранее установить критерии (вроде интересности и уместности). В некоторых моделях поиска с применением NLP рабочее предположение состоит в том, что при интеллектуальном поиске должен анализироваться профиль потребителя для сокращения пути к заключительному результату.

Заключение

Полученные выводы о том, что беседа на естественном языке с автоматической системой в ходе поиска вполне возможна и такое взаимодействие уменьшает информационную перегрузку и, таким образом, время, которое пользователи тратят на поиск, тоже уменьшается. Но те проблемы, с которыми всё равно приходится сталкиваться как пользователям, так и разработчикам говорит о том, что интеллектуальные поисковые системы ещё находятся в ходе усиленных разработок. Но то, что с таким увеличением информации требуется более интеллектуальный подход, уже не сомневаешься. Выбрать из несколько тысяч вариантов нужное просто иногда невозможно, и мы останавливаемся на подходящем для нас варианте. С развитием интеллектуальных поисковых систем, мы должны получить от Сети стопроцентный или хотя бы почти стопроцентный результат поиска, тогда можно будет говорить и о развитии интеллектуальных систем и о шаге к будущим техническим открытиям.

Список литературы

  1. Гаврилова Т. А., Хорошевский В. Ф. Базы знаний интеллектуальных систем. - С-Пб.: Питер, 2000. - 384 с.
  2. A. Levy, D. Weld, Intelligent Internet Systems. Artificial Intelligence, 2000.
  3. http://www.osp.ru/os/2005/11.html (ОС №11, 2005г.)

Глава 8. Перспективные технологии сети Интернет