Историческая справка развития АИПС.
Лекция 9
ИПЯ (продолжение)
Для соединения слов тезауруса во фразы используются грамматические средства ИПЯ – это правила составления поисковых образов с помощью дескрипторов ИПТ.
Грамматики, применяемые в ИПЯ, бывают самые различные. Одни определяют порядок в дескрипторах ПОД и ПОЗ, другие же приписывают каждому дескриптору числа, характеризующие их значимость для поискового образа, третьи указывают на роль каждого дескриптора с помощью специальных указателей.
Применение грамматических средств позволяет более точно передавать содержание документа и тем самым улучшать поисковые характеристики ИПС.
Пертинетность – это соответствие содержания документов информационной потребности пользователей.
Т.о. если ИПС выдала релевантный ответ, это еще не значит, что он пертинентный.
Законы Моэрса 1960 г.
1-й закон: Потребитель уклоняется от использования ИПС всякий раз, когда для него затруднительно и хлопотно искать информацию, чем обойтись без нее.
2-й закон: Как цветовые таблицы служат средством обнаружения дальтонизма у человека, так и метод дескрипторов есть средство выявления лиц «привязанных к словам» или «невосприимчивых к идеям».
Совершенствование ИПЯ во многом зависит от достижений теории в области семантической информации и направлений лингвистики. Одной из наиболее сложных задач в этой области является обучение компьютера такой трудоемкой операции как реферирование документов.
Лингвистические средства входят в состав лингвистического обеспечения АИПС.
АИПС на базе ЭВМ появились еще в 60-х годах. 1961 г. – 121 ИПС созданы в мире и 16 из них на базе ЭВМ. В настоящее время мы переживаем 4-й или 5-й период развития ИС, который характеризуется применением интеллектуальных методов поиска информации (1-й период – 50-е годы; 2-й период – 60-е годы; 3-й период – 80-е годы; 4-й период – 90-е годы, 5-й период – с 2000 года).
В настоящее время говорят о развитии интегральных информационных систем, которые объединяют в себе выполнение сразу нескольких поисковых функций.
Например, к задачам, решаемым такими системами, относят:
- Ретроспективный поиск информации, при котором ИПС отыскивает документы с необходимыми сведениями и фактами во всем накопленном массиве документов, но делается это по разовым запросам (вопрос-ответ);
- Избирательное распространение информации – это поиск по постоянным запросам некоторого ограниченного числа пользователей (абонентов), который осуществляется через установленные промежутки времени только в массиве документов, поступивших за это время в ИПС, причем между данной системой и ее абонентами поддерживается постоянная обратная связь;
- Подготовка реферативных журналов по различными указателями;
- Подготовка бюллетеней сигнальной информации, быстро оповещающей потребителя обо всех публикациях по интересующим их вопросам, предметом и темам. Например, бесплатная рассылка прайс-листов по подпискам в Интернете.
Кроме этих основных функций ИПС выполняет вспомогательные функции, например, статистическую обработку ключевых слов с целью автоматизированного построения тезауруса; автоматический перевод на ИПЯ (автоматическое индексирование).
Некоторые проблемы поиска и хранения информации в ИПС
1. Современные ИПС тесно связаны с развитием ЭВМ, и поколение ИПС совпадает практически с развитием ЭВМ.
2. Для ИПС существует ряд проблем связанных с выполнением ее функций.
Основные функции – это организация поиска информации, для которого характерно выполнение ряда критериев: время (главный критерий), смысловое соответствие (релевантность, пертинентность, точность). Эти проблемы связаны с алгоритмичностью и методологией построения тезаурусов.
3. Проблема ввода информации. В настоящее время считается, что человечество за 1 год накапливает 2 Пбайт информации, которую требуется ввести в информационную систему.
История ввода информации первоначально была реализована на базе перфокарт и перфолент. Развитие способа ввода информации происходило одновременно с развитием архитектуры ЭВМ, которая позволила работать в режиме разделения времени. Появилась возможность одновременного доступа к системам сразу нескольких пользователей, часто удаленных от ЭВМ на большие расстояния. Начало этому процессу – начало 60-х годов.