Представление документов в HTML

Информационные технологии WWW

Назовите программы-клиенты и серверы протокола FTP.

Перечислите команды протокола FTP.

Перечислите команды прикладных протоколов электронной почты.

Перечислите программы-клиенты электронной почты.

Перечислите команды Telnet.

7. Что такое Ну telnet?

8. Какие протоколы электронной почты вам известны?

9. Что такое почтовый сервер?

11.Какие разновидности почтовых адресов вам известны?

13.Что такое протокол NNTP? Перечислите команды протокола.

16.Что такое Gopher? Какова структура взаимодействия программы-кли­ента и сервера?


Глава 7

ИНФОРМАЦИОННЫЕ СИСТЕМЫ INTERNET (ТЕХНОЛОГИИ WWW И WAIS)

Файловые системы Internet, рассмотренные выше, во многом аналогичны файловым системам операционных систем ЭВМ (Unix, DOS и пр.), которые они, собственно, и имитируют. На­вигация в таких структурах весьма ограничена — «вверх» и «вниз» по ветвям каталогов (директорий). Поиск информации почти исключен, поскольку связь между содержанием данных и наименованиями файлов или каталогов весьма ограничена. Аль­тернативным подходом является организация информационных систем, позволяющих проводить содержательный поиск данных в распределенной БД. Применительно к Internet такими техно­логиями являются WWW и WAIS.

Основными компонентами данных технологий, состоящих в применении гипертекстовой модели к информационным ресур­сам, распределенным в Internet, являются (рис. 7.1):

• HTML — язык гипертекстовой разметки документов;

• URL — универсальный способ адресации ресурсов в сети;

• HTTP (HyperText Transfer Protocol) — протокол обмена ги­пертекстовой информацией;

• также дополнительные средства (CGI, Java, JavaScript). Ранее уже были рассмотрены основные возможности HTML

как приложения SGML к описанию типов документов. Здесь мы вкратце остановимся на интерфейсных и навигационных компо­нентах HTML.


Протокол Другие Рис. 7.1. Архитектура WWW-технологии

 

Гипертекстовая база данных в концепции WWW — это набор текстовых файлов, написанных на языке HTML, который опре­деляет форму представления информации (разметка) и структуру связей этих файлов (гипертекстовые ссылки).

Такой подход предполагает наличие еще одной компоненты технологии — интерпретатора языка. В World Wide Web функции интерпретатора разделены между сервером гипертекстовой базы данных и интерфейсом пользователя.

Сервер, кроме обеспечения доступа к документам и реализа­ции гипертекстовых ссылок, осуществляет также препроцессор- ную обработку документов, в то время как интерфейс пользова­теля проводит интерпретацию конструкций языка, связанных с представлением информации.

Последней версией языка HTML является версия 4.0, кото­рая находится в стадии развития. Если первая версия языка (HTML 1.0) была направлена на представление языка как тако­вого, где описание его возможностей носило, скорее, рекомен­дательный характер, версия HTML 2.0 фиксировала практику использования конструкций языка, версия HTML++ представ­ляла новые возможности, расширяя набор элементов HTML в сторону отображения научной информации и таблиц, а также улучшения стиля компоновки изображений и текста, версия 3.0 призвана упорядочить все нововведения и согласовать их с су­ществующей практикой. В версии HTML 4.0 введено понятие стиля, упрощающего создание текстов различного оформления.

HTML ориентирован на решение нескольких важных задач, в которых участвуют его различные конструкции и элементы:

• описание структуры документа (head, body, hi—нб, шрифты, списки и пр.);

• адресация ресурсов (base, link, hrefи пр.);

• создание гипертекстовых ссылок и управление навигацией в БД локальных и WWW Internet (hrefи т. п.);

• реализация интерфейсов с пользователем (isindex, menu,

form и Пр.).

Данные представляют собой иерархию элементов, каждый из которых имеет имя и атрибуты и несет некую информацию. Большинство элементов представлены в документе в виде на­чальной метки, указывающей имя и атрибуты. Далее следует собственно содержание элемента и конечная метка.