Лекция 6. ИНФОРМАЦИОННЫЕ СИСТЕМЫ

Дескрипторная система классификации

Фасетная система классификации

Иерархическая система классификации

Иерархическая система классификации (рис. 5.1) строится следующим образом:

- исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень;

- каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень;

- каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень, и т.д.

Учитывая достаточно жесткую процедуру построения структуры классификации, необходимо перед началом работы определить ее цель, т.е. какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки классификаций.

 

 

 


Рис. 5.1 Иерархическая система классификации.

 

Запомните! В иерархической системе классификации из-за жесткой структуры особое внимание следует уделить выбору классификационных признаков.

В иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбранного классификационного признака. Для последующей группировки в каждом новом классе необходимо задать свои классификационные признаки и их значения. Таким образом, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии.

Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.

Достоинства иерархической системы классификации:

- простота построения;

- использование независимых классификационных признаков в различных ветвях иерархической структуры.

Недостатки иерархической системы классификации:

- жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки;

- невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.

Пример. Поставлена задача - создать иерархическую систему классификации для информационного объекта «Факультет», которая позволит классифицировать информацию обо всех студентах по следующим классификационным признакам: факультет, на котором он учится, возрастной состав студентов, пол студента, для женщин - наличие детей.

Система классификации представлена на рис. 5.2 и будет иметь следующие уровни: 0-й уровень. Информационный объект «Факультет»; 1-й уровень. Выбирается классификационный признак - название факультета, что позволяет выделить несколько классов с разными названиями факультетов, в которых хранится информация обо всех студентах. 2-й уровень. Выбирается классификационный признак - возраст, который имеет три градации: до 20 лет, от 20 до; 30 лет, свыше 30 лет. По каждому факультету выделяются три возрастных подкласса студентов. 3-й уровень. Выбирается классификационный признак - пол. Каждый подкласс 2-го уровня разбивается на две группы. Таким образом, информация о студентах каждого факультета в каждом возрастном подклассе разделяется на две группы - мужчин и женщин. 4-й уровень. Выбирается классификационный признак - наличие детей у женщин: есть, нет.

Созданная иерархическая система классификации имеет глубину классификации, равную четырем.

 

Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами (facet - рамка). Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.

 


Рис. 5.2 Пример иерархической системы классификации для информационного объекта «Факультет».

 

Пример. Фасет цвет содержит значения: красный, белый, зеленый, черный, желтый.

Фасет специальность содержит названия специальностей.

Фасет образование содержит значения: среднее, среднее специальное, высшее.

Схема построения фасетной системы классификации в виде таблицы отображена на рис. 5.3. Названия столбцов соответствуют выделенным классификационным признакам (фасетам), обозначенным Ф1, Ф2, ..., Фi, ..., Фn. Например, цвет, размер одежды, вес и т.д. Произведена нумерация строк таблицы. В каждой клетке таблицы хранится конкретное значение фасета. Например, фасет цвет, обозначенный Ф2, содержит значения: красный, белый, зеленый, черный, желтый.

Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты. Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования: Ks= (Ф1, Ф2, ..., Фi, ..., Фn), где Ф1, Ф2, ..., Фi, ..., Фn фасеты; n — количество фасетов.

 

 

 


Рис. 5.3. Фасетная система классификации

 

При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись. Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета.

Достоинства фасетной системы классификации:

- возможность создания большой емкости классификации, т.е. использования большого числа признаков классификации и их значений для создания группировок;.

- возможность простой модификации всей системы классификации без изменения структуры существующих группировок.

Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.

Пример. Обратитесь к содержанию примера, где показано построение иерархической системы классификации. Для сопоставления разработаем фасетную систему классификации. Сгруппируем и представим в виде таблицы (рис. 5.4) все классификационные признаки по фасетам:

- фасет «название факультета» с пятью названиями факультетов;

- фасет «возраст» с тремя возрастными группами;

- фасет «пол» с двумя градациями;

- фасет «дети» с двумя градациями.

Структурную формулу любого класса можно представить в виде:

Кs=(Факультет, Возраст, Пол, Дети).

Присваивая конкретные значения каждому фасету, получим следующие классы:

- K1= (Радиотехнический факультет, возраст до 20 лет, мужчина, есть дети);

- К2= (Коммерческий факультет, возраст от 20 до 30 лет, мужчина, детей нет);

- К3 - (Математический факультет, возраст до 20 лет, женщина, детей нет) и т.д.

 

Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска. Суть дескрипторного метода классификации заключается в следующем:

- отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы;

- выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребляемых;

- создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

 

Название факультета Возраст Пол Дети
Радиотехнический До 20 лет М Есть
Коммерческий 20-30 лет м Нет
Математический До 20 лет ж Нет
     

 

Рис. 5.4. Пример фасетной системы классификации для информационного объекта «Факультет»

 

Пример. В качестве объекта классификации рассматривается успеваемость студентов. Ключевыми словами могут быть выбраны: оценка, экзамен, зачет, преподаватель, студент, семестр, название предмета. Здесь нет синонимов, и поэтому указанные ключевые слова можно использовать как словарь дескрипторов.

В качестве предметной области выбирается учебная деятельность в высшем учебном заведении. Ключевыми словами могут быть выбраны: студент, обучаемый, лечащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор, коллега, факультет, подразделение университета, аудитория, комната, лекция, практическое занятие, занятие и т.д. Среди указанных ключевых слов встречаются синонимы, например; студент, обучаемый, учащийся; преподаватель, учитель, педагог; факультет, подразделение университета и т.д. После нормализации словарь дескрипторов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, доцент, профессор, факультет, аудитория, лекция, практическое занятие и т.д.

Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов: синонимические, указывающие некоторую совокупность ключевых слов как синонимы; родовидовые, отражающие включение некоторого класса объектов в более представительный класс; ассоциативные, соединяющие дескрипторы, обладающие общими свойствами.

Пример. Синонимическая связь: студент - учащийся - обучаемый. Родовидовая связь: университет - факультет - кафедра. Ассоциативная связь: студент - экзамен - профессор - аудитория.

 

В прошлом информация считалась сферой бюрократической работы и ограниченным инструментом для принятия решений. Сегодня информацию рассматривают как один из основных ресурсов развития общества, а информационные системы и технологии как средство повышения производительности и эффективности работы людей.

Наиболее широко информационные системы и технологии используются в производственной, управленческой и финансовой деятельности, хотя начались подвижки в сознании людей, занятых и в других сферах, относительно необходимости их внедрения и активного применения. Это определило угол зрения, под которым будут рассмотрены основные области их применения. Главное внимание уделяется рассмотрению информационных систем и технологий с позиций использования их возможностей для повышения эффективности труда работников информационной сферы производства и поддержки принятия решений в организациях (фирмах).

Цель последующих лекций - изложить основные идеи, связанные с использованием информационных систем и информационных технологий, познакомить с существующим разнообразием типов систем, определяющих соответствующую информационную технологию работы на персональном компьютере в целях поддержки принятия решений.