Гипертекстовая технология.

Способ хранения информации в виде отчетов, докладов, файлов и т.д. не удобен, так как приводит к значительным потерям времени при поиске связанных единой тематикой или смыслом данных. Поэтому был разработан метод размещения информации по принципу ассоциативного мышления. Он заключается в построении смысловых (ассоциативных) связей между сходными, близкими понятиями, темами, идеями. Этот метод был реализован в шестидесятых годах прошлого столетия Теодором Нельсоном и назван гипертекстовой технологией. Текст, представленный посредством гипертекстовой технологии, называют гипертекстом.

Обычно любой текст в компьютере представляется как одна строка символов, которая читается в одном направлении, то есть он не имеет структуры. Гипертекстовая технология заключается в том, чтобы представить его в виде иерархической структуры типа графа или сети. Для этого материал текста делится на фрагменты (страницы, статьи, файлы), которые тоже могут не иметь структуры. Каждый фрагмент дополнен связями с другими фрагментами, что позволяет уточнить информацию об изучаемом предмете и двигаться по тексту в одном или нескольких направлениях по выбранным связям.

При установлении связей можно опираться на разные основания (ключи). Ключи должны отражать смысловую, семантическую близость связываемых фрагментов. Следуя по ключу можно получить более подробные или сжатые сведения об изучаемом объекте. При этом можно читать весь текст, или осваивать материал, пропуская известные подробности. Текст теряет свою замкнутость, становится принципиально открытым, в него можно вставлять новые фрагменты, указывая для них связи с имеющимися фрагментами, или убирать ненужные сведения. Структура текста (базы данных, любого другого материала) не разрушается, и вообще у гипертекста нет раз и навсегда заданной структуры. Таким образом, гипертекстовая технология - это технология представления неструктурированной свободно наращиваемой информации. Этим она отличается от других технологий, где создаются модели структурирования данных, например, в базах данных.

Обработка гипертекста открыла новые возможности освоения информационного материала, отличающиеся от традиционного. Вместо поиска информации по ключу (например, по запросу в базах данных) гипертекстовая технология предлагает перемещение по ключу от одних объектов информации к другим с учетом их смысловой, семантической близости.

Гипертекстовая технология ориентирована на обработку информации не вместо человека, а вместе с человеком, т. е. становится авторской. Удобство ее использования состоит в том, что пользователь сам определяет подход к изучению или созданию материала с учетом своих индивидуальных способностей, знаний, уровня квалификации и подготовки. Гипертекст содержит не только информацию, но и аппарат ее эффективного поиска для перемещения.

Структурно гипертекст состоит из информационного материала, тезауруса гипертекста, списка главных тем и алфавитного словаря.

Информационный материал подразделяется на информационные статьи, состоящие из заголовка статьи и текста. Информационная статья может представлять собой файл, закладку в тексте, web-страницу и др. Заголовок (имя файла) - это название темы или наименование описываемого в информационной статье понятия. Текст информационной статьи содержит традиционные определения и понятия, то есть содержит описание темы. Он должен быть легко обозримым, чтобы пользователь мог понять, стоит ли его внимательно читать или перейти к другим, близким по смыслу статьям. Текст, включаемый в информационную статью, может сопровождаться пояснениями, числовыми и табличными примерами, документами, рисунками, диаграммами, объектами реального времени (аудио и видео).

В тексте информационной статьи выделяются ключи,или гиперссылки, являющиеся заголовками связанных информационных статей, в которых может быть дано определение, разъяснение или обобщение выделенного понятия. Ключи должны визуально отличаться (подсветка, выделение, другой шрифт и т.д.) от остального текста. Ключом может служить слово или предложение. Они обеспечивают ассоциативную, семантическую, смысловую связь или отношение между информационными статьями.

Тезаурус гипертекста - это автоматизированный словарь, отображающий семантические отношения между информационными статьями и предназначенный для поиска слов по их смысловому содержанию. Термин “Тезаурус” был введен для названия энциклопедии. С латыни этот термин переводится как сокровище, запас, богатство.

Тезаурус гипертекста состоит из тезаурусных статей. Тезаурусная статья имеет заголовок и список заголовков родственных тезаурусных статей, где указаны тип родства и заголовки информационных статей. Заголовок тезаурусной статьи совпадает с заголовком информационной статьи. Тип родства или отношений определяет наличие или отсутствие смысловой связи. Существуют референтные и организационные типы связи родства, или отношений.

Референтные отношения указывают на смысловую, семантическую, ассоциативную связь двух информационных статей. В информационной статье, на которую сделана ссылка, может быть дано определение, разъяснение, понятие, обобщение, детализация понятия, выделенного в качестве ключа. Референтные отношения реализуют семантическую связь типа: род - вид, вид - род, целое - часть, часть – целое. Пользователь получает более общую информацию по родовому типу связи, а по видовому – более детальную информацию без повторения общих сведений из родовых тем. Тем самым глубина индексирования текста зависит от родо - видовых отношений.

Рассмотрим пример референтных связей. Приложение Excel предоставляет пользователю несколько типов функций. По ключевому слову ФУНКЦИЯ на экране появляется список типов функций. Выбрав тип функции, например ФИНАНСОВЫЕ ФУНКЦИИ, пользователь видит список финансовых функций. Выбрав наименование финансовой функции (например, БЗ – определение вклада), пользователь получает информацию о том, что является результатом функции (значение вклада) и какие параметры надо задать для его вычисления.

К организационным отношениям относятся те, для которых нет ссылок с отношениями род – вид, целое – часть, то есть между информационными статьями нет смысловых связей. Они позволяют создать список главных тем, оглавление, меню, алфавитный словарь.

На основе референтных и организационных отношений может быть построена гипертекстовая модель текста (не структурируемого материала). Гипертекстовая модель изображается в виде сети или графа. Модель референтных отношений обычно изображается сетью. Модель организационных отношений изображается в виде графа или сети. В вершинах сети или графа (узлах) находятся заголовки информационных статей (имена файлов, страниц, закладок). Ребро определяет ключ (гиперссылку) для связи с другой информационной статьей, то есть ключ служит указателем заголовка в списке заголовков тезаурусной статьи. Тем самым тезаурус гипертекста реализует поисковый аппарат по смысловым и организационным связям.

Пример гипертекстовой модели приведен на рис.2.1. Для простоты изложения информационная статья примера содержит одну фразу, в которой выделены ключи. В скобках дан заголовок информационной статьи (имя файла). Текст информационных статей примера приведен ниже.

Институт состоит из факультетов . (ИНСТ)

На факультете обучаются студенты разных курсов. (ФАК)

Курс – одна или более групп студентов. (КУРС)

Группа состоит из нескольких студентов. (ГР)

Студент – тот, кто учится в институте. (СТУД)

Рис. 2.1. Пример гипертекстовой модели

В примере тезаурусная статья ИНСТ(ФАК) содержит список из одного заголовка ФАК, на которое указывает ключевое слово ФАКУЛЬТЕТ. А список тезаурусной статьи ФАК(СТУД, КУРС) содержит два имени. По ключевому слову СТУДЕНТ будет выбрана информационная статья СТУД, по ключевому слову КУРС - информационная статья КУРС. В данном примере все ссылки - референтные.

Модель гипертекста позволяет структурировать материал, выделить основные и частные пути создания и просмотра материала, чтобы пользователь не пропустил главного, не «утонул» в деталях, понял смысл написанного. Умение построить гипертекстовую модель облегчает создание web-страниц, гипертекстовых документов и баз гипертекстовых документов. Пользователю гипертекстовая модель обеспечивает комфорт при работе с гипертекстом.

Тезаурус гипертекста может содержать не только простые, но и составные ссылки. Они образуют неявные ссылки. Примером их использования служат тематические каталоги для поиска в сети Интернет.

Формирование тезаурусных статей в соответствии с моделью гипертекста означает индексирование текста. Полнота связей, отражаемых в модели, и точность установления этих связей в тезаурусных статьях, в конечном итоге, определяют полноту и точность поиска информационной статьи гипертекста.

Список главных тем содержит заголовки информационных статей с организационными отношениями. Обычно он представляет собой меню, содержание книги, отчета или информационного материала.

Алфавитный словарь содержит перечень наименований всех информационных статей в алфавитном порядке. Он реализует организационные отношения.

Гипертексты, составленные вручную, используются давно. К ним относятся справочники, энциклопедии, а также словари, снабженные развитой системой ссылок.

Область применения гипертекстовых технологий очень широка. Первыми распространенными инструментами создания гипертекста стали приложения Hypercard, QuickTime фирмы APPLE для персональных компьютеров Мacintosh, приложение Linkway корпорации IBM. В большинстве современных приложений гипертекст используется для построения перекрестных ссылок, например, во всех офисных приложениях. Вся помощь в приложениях (help) составляется с использованием гипертекстовой технологии. Гипертекстовая технология конвергирована во многие информационные технологии и системы.