Операция поиска.
Состав и содержание информационных технологий
Технология вообще, и информационная в частности, – это, прежде всего, цепь процедур и операций, выполняемых последовательно (параллельно) во времени. Это не просто комплекс различных научных и инженерных знаний, а свод правил, регламентирующих выполнение технологических процедур. Как уже отмечалось информационная технология – это совокупность методов и средств для сбора, передачи, обработки, хранения и выдачи информации потребителям с мощью средств компьютеризации и коммуникаций или без таковых. Понятие информационной технологии, таким образом, неотделимо от той среды, в которой она реализована (технической, программной, организационной и т.д.).
Бессмысленно говорить об информационной технологии без ориентации на ее пользователя. Пользователями являются сотрудники, находящиеся на различных уровнях иерархии управления предприятие, организацией, офисом и т.д. На рис. 4.1 представлена типовая трехуровневая структура системы управления предприятием, на каждом из которых применяется своя информационная технология (слева). Справа показано дерево целей, согласно которому происходит управление
Каждый уровень определяет собственные инструментальные средства, предоставляемые соответствующим информационным сервисом. На рис. 4.1 таковыми представлены технологии TPS, MIS, DSS и ESS (см. расшифровку аббревиатуры ниже). Если информационная система создана в соответствии со стандартами открытых систем, то интеграция информационных технологий обеспечивается на всех уровнях иерархии.
Так как понятие информационной технологии многоуровневое, поэтому каждую из перечисленных технологий можно представить с помощью иерархии их составляющих. Иерархия в данном случае отражает взаимоотношения вида “целое-часть” либо “род-вид”. Обратимся к рис. 4.2, где представлена типовая иерархия информационной технологий предприятия или организации.
Информационную систему предприятия, организации, офиса и т.д. можно рассматривать как технологию первого уровня, которая включает в себя технологии второго уровня. К таковым, согласно рис. 4.2, относятся транзакционные технологии (TPS-технологии: Transactions Processing Systems),
управленческие информационные системы (MIS-технологии: Management Information Systems), (технологии аналитической обработки данных (DSS-технологии: DSS-Decision Support Systems) и технологии интеллектуальной обработки данных (ESS-технологии: ESS - Executive Support Systems). Каждая из перечисленных технологий в свою очередь состоит из подтехнолгий.
Транзакционные технологии (TPS) предназначены для ежедневной обработки поступающих в виде документов сообщений (счета, акты, накладные и т.д.), что позволяет создавать различные отчеты, сводки, ведомости, Такого рода результирующие документы необходимы для оперативного управления производственного, снабженческого, реализационного или иного процесса.
Технологии аналитической обработки данных (DSS) необходимы для подготовки (формирования) управленческих решений. Исходной информацией здесь служат не ежедневно поступающие сообщения, а специально накопленные данные за длительный период, позволяющие определять тенденции процессов или событий в различных разрезах.
Технологии, поддерживающие управленческие функции (MIS) предназначены для автоматизации планирования деятельности предприятия (организации), а также для организации контроля над ходом выполнения планов производства и реализации продукции.
Технологии интеллектуальной обработки данных (ESS) используются в том случае, если необходимо решать плохо структурированные задачи, отличающиеся нечеткими характеристиками. Такие технологии позволяют превращать данные в информацию, а информацию в знания.
Все технологии связаны между собой информационно, отсюда их создание должно базироваться на стандартах интерфейсов. На рис. 4.2 они представлены в виде вложенности одних технологий в другие (принцип матрешки).
Теперь необходимо рассмотреть основные функции, выполняемые сотрудниками управления с помощью информационных технологий на каждом из уровней управления.
Оперативный уровень.Главная функция данного уровня состоит врегистрации в базе данных всех событий происходящих на предприятии и за его пределами. TPS-технология включает ряд базовых, таких как OLTP-технология (On-line Transaction Processing), web-технология, офисная технология и, как правило, технологии поддержки потоков работ (workflow) и поддержки потоков документов. Для этого создаются АРМы бухгалтеров, менеджеров, начальников цехов, отделов, кладовщиков, нормировщиков, кассиров и т.д. Эти специалисты осуществляют непосредственный контакт с внешней средой: прием заказов, регистрация поступления материалов от поставщиков и передача их на склад, выписка счетов, нарядов на оплату труда и т.д. В результате функционирования TPS-технологии получают стандартные документы: платежные поручения, счета, расходные и приходные накладные и т.д.
Транзакционные информационные технологии предназначена для решения хорошо структурированных задач, по которым имеются необходимые входные данные и известны алгоритмы и другие стандартные процедуры их обработки.
На тактическом уровне решаются следующие задачи:
- обработка данных об операциях, производимых фирмой;
- создание периодических контрольных отчетов о состоянии дел в фирме;
- получение ответов на всевозможные текущие запросы и оформление их в виде бумажных документов или отчетов.
Так как оперативный ввод и обработка информации осуществляется на любом предприятии, поэтому транзакционные технологии присутствуют на большинстве из них. Примером простейшей транзакционной системы OLTP-технологии может служить любая бухгалтерская система, если на предприятии не внедрена одна из интегрированных информационных систем.
На нижнем уровне поддерева TPS-технологий большей частью используются базовые информационные технологии, которые можно классифицировать по виду обрабатываемой информации. Под базовой информационной технологией понимается такой набор составляющих ее инструментальных программных и других средств, которые, с точки зрения конечного пользователя, далее не делятся. На рис 4.3. представлены распространенные базовые технологии и обрабатываемая с их помощью информация.
На тактическом уровне используются две технологии, первая из которых предназначена для автоматизации управленческой деятельности (MIS-технологии), а вторая для поддержки принятия решений - СППР (DSS-технология). MIS-технология необходима для организации функций планирования снабжения, производства и реализации готовой продукции, финансового планирования, контроля их выполнения и составления отчетов для руководства.
Вторая технология, функционирующая на данном уровне, известная как система поддержки принятия решений (DSS).
В настоящее время достаточно распространенной технологией, ориентированной на поддержку принятия решений, является OLAP-система. Ряд современных ERP-систем, например, таких как MS Navision, поддерживает аналитическую обработку данных средствами OLAP-технологий (On-line Analytical Processing). В основу данной технологии положен метод хранения данных в специальной форме, названной хранилищем данных (Date Warehouse).
Для принятия решений на уровне управленческого контроля информация должна быть представлена в агрегированном виде так, чтобы просматривались тенденции изменения данных, причины возникших отклонений и возможные решения. На этом этапе решаются следующие задачи обработки данных:
- оценка планируемого состояния объекта управления;
- оценка отклонений от планируемого состояния;
- выявление причин отклонений;
- анализ возможных решений и действий.
Тактический уровень управления направлен на создание следующих видов отчетов:
1. Специальные отчеты создаются по запросам управленцев или когда в компании произошло что-то незапланированное.
2. Сравнительные отчеты содержат данные, полученные из различных источников или классифицированные по различным признакам и используемые для целей сравнения.
3. Чрезвычайные отчеты содержат данные исключительного (чрезвычайного) характера.
Использование отчетов для поддержки управления оказывается особенно эффективным при реализации так называемого управления по отклонениям.
Согласно рис. 3.4 на нижнем уровне управления в основном используется OLTP-технология, на верхнем – OLAP-технология, а на среднем - и та и другая.
На высшем уровне структуры управления – стратегическом, используются технологии поддержки руководства (ESS). Эти системы ориентированные в основном на работу с внешними, по отношению к предприятию, данными, характеризующимися нечеткостью, неполнотой, противоречивостью. Примером здесь может служить информация о конкурентах, ситуациях на рынке, перспективы изменения тех или иных цен на продукцию, энергоносители, изменение таможенных тарифов и т.д. Сегодня уже разработаны специальные средства для борьбы с нечеткостью в данных.
В классе ESS-технологий можно выделить три наиболее распространенных подкласса: интеллектуальный анализ данных (BI-технологии: Business Intelligence), системы обработки знаний (экспертные системы) и агентно-ориентированные системы. В свою очередь BI-технологии включают
- DM: Data Mining (технологии интеллектуального анализа данных)
- технологии обработки нечеткой информации;
- нейротехнологии.
DM-технологии предназначены для поиск закономерностей и связей между различного рода объектами и процессами. (явлениями). Разницу между OLAP –технологией и Data Mining можно продемонстрировать с помощью решения следующей проблемы:
Проблема | Какой вопрос можно сформулировать для OLAP-технологии | Какой вопрос можно сформулировать для DM-технологи |
Снижение количества клиентов | Какова динамика средних размеров счетов настоящих и бывших клиентов | Каков характерный портрет клиента, который может отказаться от услуги |
Другим примером DM-задачи может служить следующее: для принятия решения на уровне предприятия важно знать существует ли связь между миграцией населения в конкретном регионе, продажами некоторого товара и ценами на дизельное топливо. Причем достоверная статистика может отсутствовать. Информация, как правило, поступает в виде текстов сообщений из газет, журналов, бюллетеней, из сети Интернет и т.д.
Задачи, решаемые с помощью DM-технологий, следующие:
- классификации – позволяют выявить признаки, характерные для некоторой группы объектов. Наличие таких признаков позволяет вновь появившийся объект отнести к одному из классов;
- кластеризация – в результате решения данной задачи исходные объекты разбиваются на однородные группы (кластеры). Наличие таких групп позволяет принять решение по отношению одной из них;
- выявление ассоциаций, то есть закономерностей, отраженных в данных, фиксирующих наступление каких-либо событий;
- выявление последовательностей, то есть закономерностей, фиксирующих наступление событий с некоторым разрывом во времени.
Создаются средства для решения перечисленных задач, среди которых можно выделить технологию нечетких систем. Появилась она как реакция на то, что традиционные компьютерные вычисления являются слишком жесткими для отражения реального мира. Существует огромное количество проблем, для решения которых невозможно получить полную и точную информацию. В результате появилось понятие «мягкие вычисления», которые были положены в основу обработки нечетких высказываний (FuzziCalk, CubiCalk, FuzziSoft).
Широкую популярность приобрели системы, предназначенные для воспроизведения неосознанных мыслительных усилий человека в форме нейросетей (NeuroShell, NeuralWorks, Neuro Solution). Нейросети, в отличие от обычных программных систем, не требуют программирования, что ставит их в ряд перспективных средств принятия решений.
Следующий класс интеллектуальных информационных технологий - системы обработки знаний, включает, прежде всего, экспертные системы, базирующиеся на таких моделях знаний как деревья вывода, деревья целей, семантические сети и т.д. Особое место здесь занимают знания, позволяющие решать обратные задачи. Если прямые задачи решаются в том случае, если необходимо знать результаты деятельности предприятия в предыдущем периоде, то для решения обратных задач необходимо знание тех значений экономических показателей или перечня действий исполнителей, которые приведут к достижению поставленных целей в будущем. Каким образом решаются подобные задачи изложено в [18].
Рассмотренные технологии являются типовыми, так как используются в процессе управления объектами в различных областях экономической деятельности: промышленности, связи, транспорте, добывающей отрасли, торговле, банковской и других сферах.
В отличие от них агентно-ориентированные системы в большинстве своем находятся в стадии апробации на реальных объекта.
Агент – вообще лицо, действующее по поручению кого-либо, представитель учреждения, уполномоченный.
Программный агент – это программа, способная действовать в интересах достижения целей, поставленной перед пользователем. Они действуют от лица пользователя. Интеллектуальные программные агенты обладают следующими свойствами:
- автономность –функционирование без вмешательства со стороны своего владельца и контроль внутреннего состояния и своих действий;
- коммуникативность – взаимодействия с другими агентами;
- реактивность – восприятие среды;
- активность- способность генерировать цели и действия рационально;
- наличие базовых знаний о себе, окружающей среде и других агентах.
Особая роль отводиться мобильным агентам – программам, которые могут перемещаться по сети.
Они покидают клиентский компьютер и перемещаются на другой для выполнения своих действий, после чего возвращаются обратно.
Примеры:
o агент перемещается на сервер, обрабатывает там данные, посылает их агенту, а затем возвращается;
o агент может отсоединить компьютер от сети и доставить результаты расчетов адресату;
o агент может выполнить расчеты на сервере, где вычислительные мощности достаточные для решения задачи, а затем возвратиться.
Таким образом, программный агент - это «активный искусственный деятель», имеющий цели, мотивацию, обязательства и желания. Искусственная жизнь – это процесс взаимодействия программных агентов.
Главное направление развития агентно-ориентированных систем связано с поведением в окружающей среде. В результате их появления стало развиваться искусственное общество, в котором воспроизводятся социальные процессы. Примером может служить множество агентов, представляющим поведение продавцов бензина (система апробировалась в Западном Йоркшире, Великобритания). Агент пользуется целью максимизировать прибыль и двумя показателями: цена бензина и производственные затраты. Агенты могут наблюдать за соседними бензоколонками. Если их цена отличается, то они уполномочены манипулировать ими в соответствии с правилами. В зависимости от динамики прибыли агент выбирает стратегию поведения.
2. Содержание основных технологических операций
Базовые информационные технологии, находящиеся на нижнем уровне иерархии технологий информационной системы, согласно дереву, представленному на рис. 4.2, как правило, состоят из этапов, процедур, операций и действий, каждая из которых содержит операции или действия.
Типовые процедуры следующие:
1. Процедура получения исходных данных, содержащая следующие операции: сбор, регистрация, ввод и контроль, передача.
2. Процедура обработки данных, содержащая логические (поиск, группировка, сортировка) и вычислительные операции.
3. Процедура передачи и потребления результатов решения задачи, содержащая следующие операции: контроль правильности результатов, передача их пользователю, архивирование и ксерокопирование.
Рассмотрим наиболее важные из них.
Сбор и регистрация информации. Сбор осуществляется либо автоматически с датчиков информации, встроенных в технологическую линию или контрольно-измерительные приборы, либо вручную путем фиксации результатов какой-либо деятельности на бумажных документах или технических средствах.
Передача информации. Передача выполняется в том случае, если существует потребность во взаимодействии между территориально удаленными пользователями. Над сообщением, посылаемым источником информации выполняется три процедуры: преобразование в соответствующую форму, кодирование и модуляция. Приемная сторона также выполняет три процедуры: демодуляция, декодирование, преобразование сообщения в первичную форму.
Операция ввода и контроля относится к наиболее трудоемким, так как она, в большинстве случаев, сопряжена с ручными действиями. Процесс ввода документов возможен двумя способами:
-ручной ввод;
-автоматизированный ввод.
Ручной ввод предполагает перенос данных с бумажного документа путем их набора на клавиатуре. Современный уровень развития технологии автоматизированной обработки предусматривает в процессе ввода применение макетов, то есть создание машинных электронных документов. Известны два варианта макетов ввода:
-копия вводимого документа;
-унифицированный макет ввода.
Первый вариант ориентирован на один вид первичного документа, второй - на несколько. Во втором случае все документы должны иметь некоторое множество одинаковых реквизитов. Например: платежные поручения, расходные кассовые ордера, накладные могут иметь одинаковые реквизиты, которые вводятся.
При вводе возможны ошибки, которые выявляются различными методами контроля. Среди многочисленных методов контроля, базирующихся на естественной избыточности. Наиболее распространенными среди которых являются:
1. Лексический
- тип реквизита (буква, цифра, специальный символ);
- контрольный разряд по модулю;
- код реквизита, хранящийся в справочнике.
2. Арифметический
- балансовый контроль;
- контрольные суммы.
3. Логический
- Использование соотношений вида =, ≠, <, >,≤, ≥.
4. Синтаксический
- количество символов в реквизите;
- количество строк в документе.
Контроль по модулю, как правило, используется в процессе передачи данных в сети. Вычисляется контрольный разряд для передаваемого кода, который к нему в конце. Определяется контрольный разряд путем вычитания из модуля (числа 10 или 11) остатка от деления на заданный модуль суммы произведений значений разрядов кода на заранее присвоенные разрядам веса (место в коде слева направо). Вначале определяется остаток (О) от деления, который вычитается из модуля. Допустим, требуется вычислить контрольный разряд для кода 1254. Остаток равен:
Контрольный разряд равен: 11-2=9.
Код примет вид: 12549.
Контроль с помощью справочника
Метод справочника основывается на специально созданных таблицах, где размещаются правильные коды (например, коды поставщиков). В процессе контроля происходит обращение к таблице-справочнику с целью поиска контролируемого кода. Если таковой найден, считается, что ошибка отсутствует.
Арифметический контроль предполагает либо балансовый контроль, либо расчет контрольных сумм. Балансовый контроль применяется в большинстве случаев при проверке результирующих ведомостей. Для этого отыскиваются суммы по строкам и графам, после чего полученные суммы, в соответствии с семантикой документа либо суммируются либо вычитаются и сравниваются с итоговой суммой последней графы. Контрольные суммы определяются дважды: вначале вручную, а за тем автоматически. Равенство результатов сигнализирует об ошибке.
Среди логических методов наиболее популярным является метод проверки границ значений кода. Он применяется если если множество разрешенных значений контролируемого реквизита находится в некоторых границах, что можно представить следующим образом:
.
Допустим значения реквизита "код склада" находится в диапазоне от 1 до 12. Тогда контроль организуется с помощью следующего правила:
.
Метод эффективен, если значения контролируемого реквизита размещены равномерно на числовой оси. Частным случаем метода проверки границ, является проверка знака вводимого значения реквизита. В большинстве случаев вводимое число должно быть положительным, что можно проконтролировать с помощью проверки числа на знак.
Среди синтаксических методов контроля часто применяется проверка количества символов в коде. Проверяться может также его структура. В процессе ввода подсчитывается количество введенных символов и проверяются значения его отдельных разрядов.
Пусть пятиразрядный табельный номер имеет следующую структуру:
- первый разряд указывает на номер цеха;
- второй-пятый – на номер работника в цеху.
Если на предприятии три цеха, то можно использовать первый разряд для контроля путем сравнения его с цифрами один, два или три.
Следующей важной процедурой информационной технологии является обработка данных. Данные, которыми оперирует компьютер, не должны представлять собой беспорядочный набор символов, хаотично расположенных в его памяти. Форма представления данных должна быть пригодной для их формальной обработки с помощью программ. Все операции данной процедуры делятся на логические (сортировка, группировку, поиск), либо на вычислительные. Среди операций, реализующих данную процедуру, вначале выясним содержание логических, а за тем вычислительных.
Операция сортировки.
Покажем на примере, какие результаты можно получить из одной и той же базы данных, если ее сортировать по различным ключам. Допустим, имеется база данных ПОСТАВКИ со следующими исходными данными:
ПОСТАВКИ СВОДКА 1
Код поставщика | Код товара | Фактически поставлено (руб.) | Код поставщика | Фактически поставлено (руб.) | |||
Всего | |||||||
Если ее сортировать по ключу "Код поставщика", то можно получить ведомость Сводка 1, где определяется общая сумма поставки каждым поставщиком. Если же ее сортировать по ключу "Код товара", то можно получить ведомость Сводка 2, которая содержит суммы поставок по кодам товаров:
Если ее сортировать по ключу "Код поставщика", то можно получить ведомость Сводка 1, где определяется общая сумма поставки каждым поставщиком. Если же ее сортировать по ключу "Код товара", то можно получить ведомость Сводка 2, которая содержит суммы поставок по кодам товаров:
ПОСТАВКИ СВОДКА 2
Код поставщика | Код товара | Фактически поставлено (руб.) | Код товара | Фактически поставлено (руб.) | ||||
Всего | ||||||||
В соответствии с классификацией информационных систем, приведенной в разделе 4.1, их условно можно разделить на документальные и фактографические. Поиск информации в них осуществляется различными методами. В документальных системах осуществляется поиск документов в соответствии с ПОЗ – поисковым образом запроса среди документов, описанных в форме ПОД – поисковым образом документа. И ПОЗ и ПОД представляются с помощью специального языка.
Главная черта документальных поисковых информационных систем состоит в получении нескольких (иногда многих) приблизительных ответов. Обусловлено это тем, что в ПОЗ указываются ключевые слова, которые могут также и в тех ПОД, которые к запросу не имею или имею опосредованное отношение.
Варианты результатов поиска иллюстрируются на рис. 4.8. Поиск требуемой информации, указанной в ПОЗ, может завершиться успешно в случае, если во множестве ПОД имеются все документы, указанные во множестве ПОЗ (см. рис. 4.8а) На рис. 4.8б представлена обратная ситуация, а именно: частичное совпадение множества ПОЗ с множеством документов ПОД, а на рис. 4.8в неуспешное – полное несовпадение множеств ПОЗ и ПОД, то есть не найден ни один требуемый документ.
Документальные информационные системы используются в Интернет, в корпоративных электронных хранилищах текстовой информации, в библиотечных, патентных, юридических и других поисковых системах
В отличие от документальных фактографические информационные системы ориентированы на точный поиск данных. Поиск осуществляется по заданным ключам, под которыми понимается признак, отображающий одну или несколько сторон искомого объекта, процесса, явления. Ключ может быть первичным или вторичным. Как правила таблица, в которой осуществляется поиск, сортируется по искомому ключу. Например, в справочнике работающих сотрудников первичным ключом служит их табельный номер, что позволяет отыскать единственную о нем запись. Однако одного реквизита может не хватить, для того, чтобы отыскать требуемую запись.
Простейшим методом поиска является последовательный перебор и сравнение текущего значения элемента данных с заданным, до первого случая их совпадения. Очевидно, что данный метод, в ряде случаев, является не очень эффективным, так как в среднем приходится просматривать половину массива.
Вычислительные операции.
Специфика экономических расчетов состоит в выполнении в подавляющих случаях арифметических операций. Пусть а1, а2, а3, …, аn числовая последовательность, обозначающая:
а1 – заработная плата сотрудника А;
а2 – заработная плата сотрудника Б и т.д.
Обозначив через аi заработную плату i-го сотрудника модно определить сумму заработной платы, начисленной всем сотрудникам на основании следующей формулы:
,
где С – общая сумма начисленной заработной платы;
- сумма заработной платы i-го сотрудника;
n – количество сотрудников.
В реальных ситуациях верхняя граница суммирования, как правило, неизвестна, поэтому формулу записывают следующим образом:
.
Довольно часто используют двойные или тройные суммы, например,
.
Если необходимо указать произведение сумм, то представить это можно так: ,
Например, .
Аналогично знаку суммирования используется знак умножения. Например, произведение можно записать как или сокращенно .
Не мало важную роль в информационных технологиях играет операция проверки правильности полученных результатов. Для ее осуществления можно воспользоваться балансовым контролем.