Лекция 4

Понятия информационного материала, тезауруса и алфавитного словаря

 

Структурно гипертекст состоит из:

- информационного материала,

- тезауруса гипертекста,

- списка главных тем,

- алфавитного словаря.

Информационный материал разделяется на информационные статьи, состоящие из заголовка статьи и текста.

Заголовок содержит тему или наименование описываемого объекта.

Информационная статья содержит традиционные понятия, должна занимать 1 панель и быть легко обозримой, чтобы пользователь смог понять, стоит ли внимательно читать эту статью или стоит перейти к другой статье.

Текст, включаемый в информационную статью, может сопровождаться вставками в виде пояснений, примеров, документов и т.д. очень часто вспомогательная информация отличается от основной выделением цветом.

Тезаурус гипертекста это автоматизированный словарь, отображающий семантические отношения между лексическими единицами дескрипторного информационно поискового языка и предназначен для поиска слов по их смысловому содержанию.

Термин тезаурус введен в 13 веке флорентийцем Лотеки, он введен для названия энциклопедии. С латыни это слово переводится как сокровище, запас, богатство.

Гипертекст состоит из тезаурусных статей. Заголовок тезаурусной статьи является наименованием объекта, описание которого содержится в информационной статье. В отличие от традиционных тезаурусов дескрипторов, тезаурус гипертекста содержит не только простые, но и составные наименования объекта. Дескриптор подразумевает описание объекта в жесткой форме. А конструктор позволяет варьировать описанием.

Формирование тезаурусной статьи гипертекста означает индексирование текста. Полнота связей отражаемых в тезаурусной статье и точность установления этих связей в конечном итоге определяют полноту и точность поиска при обращении к данной статье гипертекста.

Существуют следующие типы родства или отношений: вид-род, род-вид; предмет-процесс, процесс-предмет; целая - часть, часть – целая и т.д. Пользователь получает более общую информацию по родовому типу связи, а по видовому специфическую информацию без повторения общих сведений из родовых тем. Т.о. глубина индексирования текста зависит от родовидовых отношений.

Список заголовков родственных тезаурусных статей представляет собой локальный справочный аппарат, в котором есть ссылки только на ближайших родственников. Тезаурус гипертекста можно представить в виде сети, в узлах находятся информационные статьи, ребра указывают на существование связи между объектами и на тип родства.

В гипертексте поисковый аппарат не делится на тезаурус и массив поисковых образов. В гипертексте весь поисковый аппарат реализуется как тезаурус гипертекста.

Список главных тем содержит заголовки всех справочных статей, для которых нет ссылок род-вид, часть – целое. Желательно чтобы этот список занимал не более 1 панели.

Алфавитный словарь является элементом гипертекста. Он включает перечень наименования всех информационных статей в алфавитном порядке.

Гипертексты, составленные в ручную, используются давно. Это справочники, словари, энциклопедии. Область применения гипертекстовых технологий очень широка.

Гипертекстовые система это Quick Time (Apple), MS разработала языки HTML, XML.