Тема 4. Компьютерные сети и телекоммуникации

Интернет (Internet) – это глобальная телематическая (информационно-компьютерная телекоммуникационная) сеть («межсеть», метасеть, «Всемирная информационная магистраль»), обеспечивающая обмен многоаспектной компьютерной информацией во всём мире между любыми подключёнными к ней средствами электронно-вычислительной техники и связи.

Являясь результатом развития созданной в 1969 г. крупномасштабной сети ARPAnet Министерства обороны США, современная ГТС Интернет стала своеобразной единой информационной средой мирового сообщества, базирующейся (начиная с 1983 г.) на сети научно-исследовательских центров США и объединяющей с помощью семейства универсальных протоколов TCP/IP (Transmission Control Protocol / Internet Protocol[1])национальные компьютерные сети различных стран.

Главным координатором в ГТС Интернет, занимающимся распределением и управлением айпи-адресов (IP-адресов) компьютеров и соответствующих им так называемых доменных имён (доменов), является некоммерческая организация Internet Corporation for Assigned Names and Numbers (ICANN). Региональные координаторы – Regional Internet Registries (RIR) располагаются на втором уровне иерархии управления сетью.

Адреса и имена компьютеров в сети. Айпи-адрес каждого компьютера представляет собой четыре числа из диапазона от 0 до 255, темаённых точками, например: 209.155.82.19. Айпи-адресам соответствуют несколько доменов, которые более удобны для пользователей сети, поскольку представляются в буквенном виде. Например, компьютер с айпи-адресом 209.155.82.19 имеет доменное имя www.cdrom.com (служит маркетинговым целям) и доменное имя webl.cdrom.com (используется для внутренних целей).

Доменные имена включают домены различных уровней, например, в доменном имени www.cdrom.com доменом первого уровня является com (Commercial organizations), второго уровня – cdrom, третьего уровня – www.

Домены первого уровня регистрируются в ICAN, часть выделяется разным странам для использования, а часть – продается компаниям, городам и организациям. В частности, России выделены[2] домены первого уровня – ru и рф. Кроме того, имена доменов могут регистрироваться с использованием различных алфавитов, например на кириллице, иврите, арабском и китайском.

Домены второго уровня во многих странах продаются или же на них передаётся право администрирования на коммерческой основе («делегирование» домена). В некоторых странах (Великобритания и др.) объектами коммерции являются домены только третьего уровня.

Владелец домена опредёленного уровня может создавать сколько угодно доменов более низких уровней. Для того чтобы установить, на чьё имя зарегистрирован определённый Интернет-домен, можно обратиться к информационному ресурсу checkdomain.com.

Компьютер в ГТС Интернет имеет также огромное количество так называемых портов, воспринимающих определённые протоколы, т. е. язык. Каждый протокол обслуживается отдельной программой. Например, если в так называемом браузере (browser – программа просмотра) набрать строку

http://www.ipform.ru,

это будет означать желание пообщаться с компьютером www.ipform.ru, используя протокол (язык) http (Hyper Text Transfer Protocol[3]). Протокол http воспринимает компьютерный порт 80 для обслуживания соответствующей программой.

Или, например, для отправки электронной почты специальная почтовая программа использует другой протокол – SMTP, который воспринимает порт 25, а при получении – протокол РОРЗ по порту 110.

Для простоты порты и протоколы называют сервисами; компьютеры, ожидающие прихода запросов на используемых протоколах – серверами; компьютеры, обращающиеся к серверам – клиентами. Компьютер одновременно может быть и клиентом и сервером или выполнять только одну из функций.

Сервис «Всемирная Паутина».Одним из сервисов ГТС Интернет является www – World Wide Web («Всемирная Паутина», действует с 1991 г.), использующая протокол http для передачи гипертекстовых документов и других файлов от www-сервера к клиентам, т. е. для получения из ГТС Интернет различной информации, расположенной по всему миру (её «страницы», содержащие тексто-графическую информацию, звуковые и видеообъекты, «переплетены» подобно нитям паутины).

Принцип работы сервиса www состоит в следующем. Пользователь запускает у себя программу browser – программу просмотра страницы html (Hyper Text Markup Language[4]), понимающую протокол http и специальный язык, на котором создается содержимое www. Далее пользователь набирает адрес www-сервера. Браузер обращается к серверу с просьбой выдать документ, расположенный по этому адресу. Сервер выдает документ. Браузер получает документ, обрабатывает его и, если в нём есть изображения, также просит сервер выдать ему их, как и другие материалы документа. Этот документ называется страницей или web-страницей (веб-страницей), или html-страницей (эйчтиэмэл-страницей). После этого браузер обрабатывает все пришедшие данные и показывает готовую страницу на экране компьютера. Некоторые элементы страницы (тест, изображения, кнопки) могут быть ссылками. Если их актуализировать (нажать), то браузер пошлет запрос серверу, указанному в ссылке, чтобы запросить у него документ, который в ней же и обозначен.

Таким образом, можно «двигаться» от документа к документу, от сервера к серверу, что превращает весь Интернет в одну гигантскую сеть, как бы связывающую документы и серверы друг с другом «нитями» гиперссылок.

На странице, кроме того, могут быть места для ввода какой-либо информации и ссылки на программу на сервере, которая должна обрабатывать эту информацию. Например, можно ввести фамилию, имя и отчество и адрес человека и нажать кнопку «Получить телефон». Тогда браузер отправит эти данные программе на сервере, которая обработает их (в данном случае найдёт соответствующий телефон) и вернет html-страницы с результатом обработки. На этом принципе построено подавляющее большинство интерактивных (т.е. способных общаться с пользователем) web-страниц и сайтов.

Web-сайт – это множество страниц, объединённых под одним доменным именем.

Например: www.raj.ru – это web-сайт, а www.raj.ru/index.html – это html-страница на web-сайте www.raj.ru. Сам по себе сервис www имеет не много возможностей, но использование программ, обрабатывающих запросы пользователей, в огромной степени их увеличивает. В написании таких программ, а также в создании красивых, легко используемых страниц состоит, в частности, труд web-разработчиков.

Сервис «Хостинг». Под хостингом понимается сервис, который предоставляет возможность пользователям размещать свою информацию на серверах в ГТС Интернет и предоставлять к ней доступ посредством использования сервиса www.

Хостинг-провайдеры – это компании, предоставляющие услуги хостинга, в частности, место на своем сервере для его использования клиентами и соединение этого сервера с ГТС Интернет. Хостинг-провайдеры могут также предоставить свои центры данных (data-центры) для размещения серверов клиентов и обеспечить их подключение к ГТС Интернет.

Кроме предоставления места на web-сервере набор услуг, составляющих хостинг, может включать возможность организации почтовых ящиков клиентов, организацию баз данных, доступ к ним, видеотрансляции и др.

Сервис «Электронная почта». Сервис «Электронная почта» (e-mail, electronic mail) – способ обмена информацией в компьютерных сетях.

Электронная почта не использует географическую адресацию. Для того чтобы электронное письмо (сообщение) дошло до своего адресата необходимо, чтобы оно было оформлено в соответствии с международным стандартом[5] и имело стандартный почтовый электронный адрес, заголовок, «тело», «конверт».

Заголовок сообщения (Message Header) – совокупность специальных полей, основными из которых являются поля From: («От кого») и То: («Кому»), создаваемых при подготовке сообщения для отправки, совместно с такими полями как Subject: («Тема») и Date: («Дата»).

Тело сообщения (Message Body) – текст письма, предназначенный для отправки пользователем (он не воспринимается почтовыми протоколами и серверами).

«Конверт» сообщения (Message Envelope) – служебная информация, добавленная почтовой программой во время транспортировки сообщения (она обычно скрывается от пользователя, но в современных программах-клиентах предусмотрена возможность её отображения). Аналог штампов на конвертах «бумажной почты».

Почтовый электронный адрес может иметь разные форматы. Наиболее широко в ГТС Интернет распространена система формирования адреса DNSDomain Name System (система доменных имён). Дешифрацию адреса и перевод его в необходимый формат осуществляют встроенные программные средства, применяемые в конкретной сети электронной почты.

Для информативности почтовый электронный адрес должен содержать:

ü идентификатор абонента (по аналогии – строка «Кому:» на почтовом конверте);

ü почтовые координаты, определяющие его местонахождение (по аналогии – дом, улица, город, страна на почтовом конверте).

Для темаения идентификатора абонента и его почтовых координат используется значок-темаитель @[6]. Почтовый электронный адрес в формате ГТС Интернет имеет вид:

имя_пользователя@имя_домена,

например,

raj-priem@mail.ru, bmw@nline.ru,

где raj-priem, , bmw – идентификаторы абонента (составляются обычно из инициалов, фамилии, имени, отчества, псевдонима, адреса, номера служебного кабинета и др.).

То, что стоит справа от знака @, называется доменом электронной почты и однозначно описывает местонахождение абонента. Составные части домена темаяются точками.

Сервис «Информационный поиск». Поиск нужной информации является одной из наиболее распространённых и одновременно наиболее сложных задач, с которыми сталкивается в ГТС Интернет любой пользователь. Умение быстро ориентироваться в ресурсах ГТС Интернет и находить требуемые информационные источники относится к числу базовых квалификационных навыков.

Причина сложности продуктивного (результативного) информационного поиска в ГТС Интернет, напоминающего «поиск иголки в стоге сена», определяется, главным образом, двумя основными факторами. Во-первых, число источников информации в сети чрезвычайно велико (на начало 2007 г. насчитывалось около 25 млрд. документов на серверах, расположенных по всему миру). Во-вторых, общий массив информации в сети не только колоссален по объёму, но ещё и крайне динамичен. Ежеминутно в сети появляются сотни новых (модифицированных) документов, десятки перемещаются на новые адреса или прекращают свое существование.

Данные обстоятельства крайне усложняют также учёт имеющихся документов. Регулярно обновляемые в печатных руководствах по работе в ГТС Интернет списки серверов устаревают уже в момент публикации, а поддерживать их в актуальном состоянии становится принципиально невозможно из-за стремительного роста количества серверов.

Необходимость и важность проблемы продуктивного информационного поиска привела к образованию в ГТС Интернет специальных поисковых систем (служб, сервисов, каталогов, машин), предназначенных для оказания помощи пользователям в их «перемещении» в виртуальном инфопространстве. Основная задача поисковых систем – обеспечить детальное отыскание информации в электронной вселенной, что можно достичь только путём индексирования (учёта) всего содержания огромного числа web-страниц. В отличие от справочников, все они функционируют в автоматизированном режиме, имеют одинаковый принцип действия и включают два базовых компонента:

ü программу-робот, задача которого путешествовать с сервера на сервер, находить там новые или изменившиеся документы и скачивать их на хост-компьютер (главный компьютер) системы (при этом программа-робот, просматривая содержимое документа, находит новые ссылки как на другие документы данного сервера, так и на внешние веб-сайты. Программа самостоятельно направляется по указанным ссылкам, находит новые документы и ссылки в них, после чего процесс повторяется вновь, напоминая хорошо известный в библиографии «метод снежного кома»);

ü программу-индексатор, задача которого обработать (проиндексировать) выявленные документы (при этом, как правило, учитывается всё содержание страницы, включая текст, иллюстрации, аудио и видеофайлы и др. Индексации подвергаются все слова в документе, что как раз и даёт возможность использовать поисковые системы для детального поиска по самой узкой тематике. Образуемые гигантские индексные файлы, хранящие информацию о том, какое слово, на каком сервере, в каком документе и сколько раз употребляется, составляют базу данных, к которой происходит обращение пользователей, вводящих в строку запроса сочетания ключевых слов).

Выдача результатов поиска осуществляется с помощью специального модуля, который производит интеллектуальное ранжирование результатов. При этом берется в расчёт местоположение термина в документе (название, заголовок, основной текст), частота его повторения, процентное соотношение искомого термина к остальному тексту страницы, а также число и авторитетность внешних ссылок на данную страницу с других веб-сайтов.

К основным характеристикам поисковых систем относятся:

ü объём индексных файлов (от нескольких сотен тысяч до триллионов!);

ü оперативность обновления базы данных за счёт включения сведений о новых материалах и удаления устаревших (в настоящее время – от двух недель до полутора месяцев);

ü возможности для составления запросов (простота интерфейса, и др.);

ü интеллектуальность системы ранжирования результатов поиска (перечень факторов, принимаемых во внимание при определении места документа в перечне ссылок, необычайно широк: от местоположения слова на странице до рейтинга-авторитета страниц, имеющих ссылки на найденный документ);

ü наличие дополнительных сервисных функций, облегчающих работу пользователя (например, возможность перевода текста документа на иностранный язык, способность выделять все документы с определённого веб-сайта, сужение критериев в ходе поиска, нахождение документов «по образцу» и др.).

По данным параметрам выделяются следующие глобальные поисковые системы, позволяющие выявлять релевантную информацию с высокой степенью полноты и надёжности:

Google ("Google" Corp.) www.google.com;

AlltheWeb ("Yahoo! Inc.") – www.alltheweb.com;

Alta Vista ("Overture Services, Inc.") – www.altavista.com;

MSN Search ("Microsoft" Corp.)– www.search.msn.com.

В России широко используются следующие поисковые системы этого класса:

Яндекс (Компания «Яндекс») – www.yandex.ru;

Рамблер (ООО «Рамблер Интернет Холдинг») – www.rambler.ru;

Апорт ("Golden Telecom")– www.aport.ru.

Поисковая система Google[7](действует с 1998 г.) является единоличным лидером среди поисковых систем всемирного масштаба по всем значимым параметрам. Главное достоинство Google– объём его индексного файла, составляющий более 3 триллионов web-страниц и статей из групп новостей по интересам.

Втopoe преимущество Google– способность индексировать документы не только в виде html-файлов, но также документы в форматах pdf, rtf, ps, doc, xls, ppt, wp5 и др. При этом Googleпозволяет моментально конвертировать страницы в указанных форматах в обычный html-файл, что освобождает пользователя от необходимости иметь специальное программное обеспечение для доступа к файлу.

Методика поиска с помощью Googleпроста. В поисковую строку водится запрос на любом естественном языке (русском, английском или др.) с использованием множества имеющихся опций для максимальной его конкретизации (при этом язык запросов не допускает усечения терминов знаком «*» («звёздочка»). Все опции доступны через меню Advanced Search – «Расширенный поиск».

Выдаваемые в результате поиска ссылки на документы, помимо традиционных сведений о заглавии документа, контексте искомых слов и данных о размере, содержат функцию Cached («Сохранено»), позволяющую полностью восстановить весь документ, если по каким-либо причинам веб-сайт, на котором он расположен, недоступен. Помимо поиска текстовых материалов, Googleобладает лучшими на сегодня возможностями поиска изображений с помощью режима Images («Изображения»). Вместе с тем при использовании Google следует помнить, что при работе с файлами большого объёма он индексирует не весь источник, а лишь его первые 101 Кбайт (для pdf-файлов лимит ограничен 120 Кбайтами), поэтому индексация документа пока не всегда гарантирует возможность его нахождении по любому фрагменту текста.

Поиск социально-правовой информации. В многочисленных поисковых системах (каталогах) обычно есть соответствующие темаы правовой тематики. Многие веб-сайты юридической тематики содержат собственные подборки ссылок. Например, веб-сайты http://www.garant.ru НПП «Гарант-Сервис», http://www.e-pravo.ru каталога «Право России», http://antitax.ru известного каталога юриста и бухгалтера и др.

На веб-сайте http://www.gov.ru государственных органов Российской Федерации представлены все ветви государственной власти РФ, а также региональные органы государственной власти.

Веб-сайт http://www.president.kremlin.ru – официальный веб-сайт Президента Российской Федерации. Сайт содержит темаы, посвящённые статусу Президента РФ, его биографии, выступлениям и рабочему графику.

На веб-сайте http://www.government.gov.ru Правительства РФ можно ознакомиться с информацией о Председателе Правительства РФ, его заместителях и членах Правительства РФ, с информацией о правовых основах деятельности Правительства РФ.

Свои веб-сайты в ГТС Интернет имеют и российские организации-разработчики справочно-правовых систем («КонсультантПлюс», «Кодекс», «Гарант», «Референт», «АРБТ», АРМ «Юрист» и др.). Кроме информации о самих СПС и условиях их приобретения, расположенной на веб-сайте, некоторые из них предоставляют онлайновый (сетевой) доступ к своим базам правовой информации.

Поставщики Интернет-услуг. ГТС Интернет объединяет множество разных сетей, расположенных по всему миру. Пользователи сети Интернет подключаются к ней через сети специализированных организаций, которые называются поставщиками услуг ГТС Интернет или Интернет-сервис-провайдерами (ISP). Провайдеры обеспечивают подключение пользователей с помощью различных линий связи. Возможны различные варианты – с использованием модема и обычной телефонной линии, выделенной линии связи, ADSL, и др. Обеспечивается подключение как отдельных компьютеров, так и локальных вычислительных сетей. Сети провайдеров связаны высокоскоростными каналами с сетями других провайдеров, обеспечивая так называемый «пиринг» (pairing – «спаривание»).

Всех провайдеров ГТС Интернет можно темаить на две основные группы:

ü первичные (крупные) провайдеры, обеспечивающие подключение пользователей к ГТС Интернет в масштабах региона (за счёт соединения сетей провайдеров информация по цепочке может дойти до любого пользователя);

ü вторичные (местные) провайдеры, обеспечивающие подключение пользователей к ГТС Интернет в масштабах области или города.

Для обсуждения проблем правового регулирования отношений, возникающих по поводу использования ГТС Интернет, в сети создан отдельный специальный развёрнутый сервер http://www.russianlaw.net.