Преобразование типа Д1 в Д2.


Преобразование типа Д1 в Н2.

Получение непрерывного сигнала из дискретного широко применяется в вычислительной техники, например, аудио система компьютера. Когда цифровой звук передается на колонки необходимо произвести обратное преобразование, чтобы человек что-то услышал. Данный процесс осуществляется при помощи специальных микросхем ЦАП (цифроаналоговых преобразователей), принцип работы которых состоит в периодическом намагничивании и размагничивании конденсаторов в зависимости от значения дискретного сигнала. Наличие в ЦАП катушек индуктивности позволяет добиться непрервного (плавного) изменения сигнала на выходе такого устройства. Если оцифровка сигнала была осуществлена правильно, то при помощи обратного преобразования будет получен сигнал практически идентичный исходному (изменения сигнала не будут восприниматься человеком).

Преобразование состоит в переходе при представлении сигналов от одного алфавита к другому — такая операция носит название перекодировка и может осуществляться без потерь.

Таким образом, преобразование сообщений без потерь возможно только в том случае, если хотя бы одно из них является дискретным. Это преимущество дискретной формы представления данных. Кроме этого существуют другие достоинства дискретной формы:

– высокая помехоустойчивость;

– простота и, как следствие, надежность и относительная дешевизна устройств по обработке данных;

– точность обработки, которая определяется количеством обрабатывающих элементов и не зависит от точности их изготовления;

– универсальность устройств.

Дискретные сообщения, составленные в различных алфавитах, посредством обратимого кодирования можно привести к единому базовому алфавиту. В качестве базового алфавита используют двоичный алфавит, а основным универсальным устройством, работающим в базовом алфавите, является компьютер. Посредством компьютера могут перерабатываться любые дискретные данные.

2.4 Понятие данных

Если изменения собственного энергетического поля зафиксированы получателем на собственном материальном носителе, то произошла регистрация взаимодействия двух материальных объектов.

F Хранимые на собственном материальном носителе получателя результаты регистрации сигналов называют данными.

Взаимодействие двух материальных объектов осуществляется через материальную среду, называемую носителем информации и определяется процессом изменения во времени характеристики данного носителя. Зарегистрированный результат взаимодействия двух материальных объектов называют данными, хранение которых на материальном носителе получателя связано с фиксацией некоторой характеристики носителя информации, которая не меняется во времени.

Одиночный сигнал является переносчиком слишком малого количества данных. Поэтому при взаимодействии используется последовательность сигналов. Совокупность сигналов от источника к получателю называют сообщением.

F Сообщение — это информационный поток, который в процессе передачи данных поступает к принимающему его субъекту.

F Информативным называется сообщение, которое пополняет знания человека, т. е. несет для него информацию.

Если существует возможность регистрации сигналов данного взаимодействия, то всегда найдется возможность воспроизведения данных, полученных при регистрации, и дальнейшей их обработки.

Процесс обработки данных представлен на рис. 8.

Рис. 8 Схема процесса обработки данных

При регистрации, воспроизведении и обработке данных получатель использует естественные, аппаратные и программные методы.

F Информационный метод — это обобщенная характеристика целей, условий и обстоятельств интерпретации данных.

Естественные методы основаны на использовании естественных возможностей человека (органов чувств и логического мышления). Они предполагают использование данных в привычном для человека виде — аналоговом.

Аппаратные методы и устройства — регистрируют сигналы и преобразуют данные к форме, доступной для естественных методов. В основном технические средства работают с дискретными сигналами. Поэтому и возникает необходимость в обеспечении взаимодействия человека и машины.

Программные методы осуществляют воспроизведение и обработку данных в соответствии с заранее предписанными условиями посредством компьютера, в котором сочетаются все три метода работы с сигналами и данными.

Из всего сказанного вытекает следующее определение:

F Информация — это продукт взаимодействия данных в форме сигналов об объекте, процессе или явлении и методов регистрации, воспроизведения и обработки этих сигналов, восполняющий незнание человека о данном объекте, процессе или явлении.

Таким образом, информационное взаимодействие материальных объектов предполагает:

– передачу данных от источника к получателю, т. е. формирование информационных сообщений источником путем изменения параметров материального носителя и выдачу сигналов сообщений в среду взаимодействия, называемую линией связи;

– прием получателем из линии связи сигналов сообщений и их регистрацию на собственном материальном носителе;

– обработку и хранение информации, т. е. приведение принятых данных к стандартной форме и сравнение полученных данных с уже имеющимися, запоминание новых данных (информации).

2.5 Свойства информации

Информация характеризуется следующими свойствами:

Динамичность. Информация существует ровно столько, сколько продолжается взаимодействие данных об объекте с методами их обработки. Как только это взаимодействие завершается, опять получаются данные, но представленные в другой форме.

! Пример: Преподаватель взаимодействует в ходе занятий со студентами, в результате чего сообщаемые им данные превращаются у студента в информацию, хранимую в головном мозге. В ходе экзамена устанавливается взаимодействие студента с преподавателем, при котором данные из головного мозга студента превращаются в информацию для преподавателя о знании или незнании вопроса студентом и далее эта информация превращается в данные в зачетные книжки.

Важность (ценность, полезность). Информация может быть важной для собеседников или представлять известные им сведения — в этом проявляется субъективность в оценке информации. Цена информации определяется связанными с ней материальными и духовными приобретениями или потерями.

Адекватность. Степень соответствия создаваемого посредством полученной информации образа содержанию оригинала (реального объекта, процесса или явления). Пример: информация об удешевлении иномарок в четыре раза на территории Московской области преподнесенная 1 апреля вполне соответствует оригиналу — первоапрельской шутке. Хотя в любой другой день она является ложной и не адекватной оригиналу.

Достоверность. Степень соответствия содержания информации реальному объекту. Это свойство связано с истинностью или ложностью информации.

Точность. Степень близости информации к описанию реального состояния объекта, процесса или явления.

Актуальность. Степень соответствия информации текущему моменту времени или степень сохранения ценности информации к моменту ее использования.

2.6 Меры информации

К измерению информации существуют два подхода: содержательный и алфавитный (кибернетический).

Содержательный подход, основываясь на информации как знании людей, предполагает следующую цепочку понятий:

Информация → сообщение → информативность сообщения → единица измерения информации → информационный объем сообщения.

F Сообщение — это поток сигналов, поступающий к принимающему его субъекту.

Информативным называют сообщение, которое пополняет знания человека, т. е. несет для него информацию. Информативно то сообщение, которое несет новые и понятные сведения. Если сообщение не информативно для человека, то количество информации в нем, с точки зрения этого человека, равно нулю. Количество информации в информативном сообщении больше нуля.

Для измерения количества информации необходимо ввести единицу измерения информации. В рамках содержательного подхода такая единица должна быть мерой пополнения знаний субъекта или мерой устранения его незнания — неопределенности в сознании субъекта.

Количество информации можно оценить величиной неопределенности, устраняемой в результате принятия сообщения.

Пусть существует объект , о котором в настоящий момент времени получатель не имеет сведений. Тогда его неопределенность равна полному незнанию об источнике данных. С получением сообщения часть неопределенности об источнике сообщения снята, но какое-то незнание осталось — . Тогда количество информации в сообщении можно измерить как разность между неопределенностью об источнике до сообщения и неопределенностью, оставшейся после получения сообщения:

Мера неопределенности об источнике сообщений получила название энтропия.

F Энтропияявляется мерой неопределенности опыта, в котором проявляются случайные события, и равна средней неопределенности всех возможных его исходов.

Для практики важно иметь возможность произвести численную оценку энтропии разных опытов. Пусть опыт имеет равновероятных исходов. Исходы равновероятны, если ни одно из них не имеет преимущества перед другими. Очевидно, что энтропия данного опыта зависит от величины , т. е. является функцией числа возможных равновероятных исходов , обладающая свойствами:

1. , поскольку возможный исход не является случайным.

2. возрастает с ростом числа возможных исходов , поскольку чем больше число возможных исходов, тем трудней предугадать результат опыта.

3. — свойство аддитивности. Пусть проводятся два (или больше) независимых опыта и с количествами равновероятных исходов в каждом соответственно и . Очевидно, мера суммарной неопределенности опытов равна сумме неопределенностей.

Таким образом, энтропия должна описываться функцией, обладающей тремя необходимыми свойствами. Такому набору свойств соответствует лишь логарифмическая функция, причем ее основание не имеет значения (). На практике выбирают основание 2, так как это оказывается удобным при принятии единицы информации бит — при равновероятных исходах бит. Энтропия опыта с равновероятными исходами — .

Энтропия одного исхода в опыте с возможными равновероятными исходами:

,

где — вероятность любого из отдельных исходов.

Таким образом, энтропия каждого возможного исхода равна:

.

Обобщая это выражение на опыт с не равновероятными исходами получим:

.

Энтропия обладает рядом свойств:

1. — вещественная и неотрицательная величина (знак минус учитывает, что значение величины под логарифмом меньше единицы, т. е. ).

2. Энтропия не учитывает содержательную сторону информации, т. е. ее ценность.

3. Энтропия нескольких независимых источников сообщений равна сумме энтропии каждого из них: .

4. Энтропия — величина ограниченная. При прочих равных условиях наибольшую энтропию имеет опыт с равновероятными исходами (рис. 9).

Рис. 9 Вид функции энтропии

Энтропия опыта равна той информации, которую получаем в результате его осуществления, т. е. — информация опыта равна среднему количеству информации одного его исхода:

Для случая, когда все исходы равновероятны ():

.

Таким образом, в случае равновероятных исходов по формуле Р. Хартли количество информации определяется числом возможных исходов. Данная формула связывает количество равновероятных состояний () и количество информации в сообщении (), что любое из этих состояний реализовалось. Ее смысл в том, что, если некоторое множество содержит элементов и принадлежит данному множеству, то для его выделения (однозначной идентификации) среди прочих требуется количество информации, равное .

Алфавитный (кибернетический) подход — это единственный способ измерения информации, циркулирующей в информационной технике (компьютерах). Здесь речь идет об измерении информации в тексте (символьном сообщении), составленном из символов некоторого алфавита. содержанию текста (семантике сообщения) такая мера информации отношения не имеет. Поэтому такой подход можно назвать объективным, т. е. не зависящим от воспринимающего его субъекта.

Базовым понятием в данном подходе является понятие алфавита.

F Алфавит — это конечное множество символов, используемых для представления информации.

F Число символов в алфавите называется мощностью алфавита.

В предположении, что вероятности появления каждого символа алфавита одинаковы (что на практике далеко не так), количество информации, которое несет в тексте каждый символ () вычисляется из уравнения Хартли:

,

где N — мощность алфавита.

Величину можно назвать информационным весом символа. Отсюда следует, что количество информации во всем тексте, состоящим из символов, равно произведению информационного веса символа на их количество:

.

Величина — информационный объем текста. Поэтому данный подход носит название объемного подхода.

Минимальная мощность алфавита, пригодного для передачи информации, равна 2. Такой алфавит называют двоичным. Информационный вес символа в двоичном алфавите: поскольку , то . Эта величина получила название бит. Один символ двоичного алфавита несет 1 бит информации.

Бит — основная единица измерения информации. Существуют и производные единицы измерения: 1 байт = 8 бит ( — мощность алфавита ПК); 1 килобайт = 1024 байта, т. е. больше 1 байта в раза; 1 мегабайт = 1024 килобайта и т. д.

Говоря о символьном сообщении как последовательности знаков определенного алфавита и считая вероятность появления каждого отдельного знака неизменной во времени (шенноновское сообщение) можно определить среднее количество информации одного знака в сообщении.

Если за исходное положение принять равную вероятность появления каждого знака в сообщении, то количество информации, приходящееся на один знак алфавита, находим по формуле Хартли:

.

Для английского алфавита бит, а для русского алфавита бит.

Определим среднее количество информации, приходящейся на один знак, если вероятности появления различных букв алфавита в сообщении не одинаковы:

.

Эту формулу открыл К. Шеннон, с работы которого (1948) принято начинать отсчет возраста информатики, как самостоятельной науки.

Следующим приближением при оценке значения информации, приходящейся на один знак алфавита, должен быть учет корреляции, т. е. связей между буквами в словах. Значение , полученное после учета бесконечного числа корреляций между буквами данного алфавита в словах, является предельным значением количества информации на один знак данного алфавита, отражающей минимальную неопределенность выбора знака алфавита без учета семантических особенностей языка.

Относительная избыточность языка показывает долю лишней информации текстов данного языка. Лишней в том отношении, что эта доля определяется структурой самого языка и может быть восстановлена в сообщении без явного выражения в буквенном виде.

2.7 Экономическая информация

Большое значение в условиях рыночной экономики приобретает своевременное и качественное использование информации в управлении всеми социально-экономическими процессами. Такую информацию принять считать экономической.

F Экономическая информация — это та информация, которая возникает в процессе производственно-хозяйственной деятельности и используется при подготовке и принятии управленческих решений. Это совокупность сведений, отражающих социально-экономические процессы и служащих для управления этими процессами и коллективами людей в производственной и непроизводственной сферах.

Рис. 10 Виды экономической информации

Входная информация (рис. 10) поступает в орган управления извне. Первичная информация поступает от объекта управления и образуется в результате измерения или подсчета. Остальная часть входной информации (осведомляющая и директивная) поступает из сторонних по отношению к управляющей системе органов. Поэтому ее называют внешней. Директивная информация исходит из вышестоящих органов и может включать параметры и условия формирования обязательных (налоговых) выплат, плановые задания, выделенные лимиты. Осведомляющая информация поступает как от вышестоящих органов, так и от организаций непосредственного контакта с объектом управления (поставщики, подрядчики, транспортные организации, посредники, финансовые институты, территориальные органы государственной власти). К источникам информации собственно об объекте управления относится нормативно-справочная информация (экономические, технологические, материальные и трудовые нормативы, расчетные коэффициенты, каталоги, номенклатурные справочники). Из входной и нормативно-справочной информации в результате обработки получается все обилие производной информации. Получение производной информации является целью обработки и определяет выбор соответствующих методов. Из производной информации следует особо выделить учетную и плановую информации, которые являются основой всего процесса управления. Окончательным итогом обработки можно считать получение выходных данных, часть которых направляется вышестоящим органам, а часть к объекту управления.

Особенности экономической информации:

– она дискретна, т. е. характеризует состояние объекта, процесса или явления либо на определенный момент времени, либо за определенный интервал времени;

– представляется преимущественно в цифровой форме;

– характеризуется большим объемом, как переменных, так и условно постоянных данных;

– имеет строго определенные сроки своего представления;

– обладает способностью к преобразованию, агрегированию по определенным признакам;

– характеризуется возможностью использования одних и тех же данных, в том числе и у разных потребителей.

Экономическую информацию можно классифицировать по следующим направлениям (рис. 10):

1. По месту возникновения — входная и выходная, внутренняя и внешняя. Входная информация — поступает в организацию извне. Выходная — информация из организации. Внутренняя информация возникает внутри объекта управления, а внешняя — за его пределами.

2. По стадии обработки — первичная, вторичная, промежуточная, результатная. Первичная — возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии. Вторичная — результат обработки первичной и может быть промежуточной или результатной. Промежуточная используется в качестве исходных данных для дальнейших расчетов. Результатная — используется для выработки управленческих решений.

3. По способу отображения — текстовая или графическая.

4. По признаку стабильности — переменная (текущая) или постоянная (условно).

5. По функциям управления — плановая, нормативно-справочная, учетная, оперативная.

Глава 3 ПРЕДСТАВЛЕНИЕ ИНФОРМАЦИИ

3.1 Понятие о формальном языке

Информацию, с которой имеет дело человек, можно разделить на два вида: на символьную и образную.

F Символьная информация представляет собой сообщение в виде последовательности знаков, воспринимаемая человеком в письменной или речевой форме.

Все остальное, не относящееся к этому, называется образной информацией.

F Образная информация — это сохраненные в памяти ощущения человека от контакта с источником, воспринимаемые всеми органами чувств человека.

Для технических систем информатики приемлема лишь дискретная форма представления данных, т. е. используются сообщения, составленные посредством какого-либо языка.

F Язык — это определенная система символьного представления информации.

Языки делятся на две группы (рис. 11): естественные и формальные.

Рис. 11 Классификация языков

Естественные языки — это исторически сложившиеся языки национальной речи. В узко профессиональных областях не всегда бывает возможным или удобным применять какой-либо естественный язык. В этих случаях возникает потребность в специальных языках. Формальные языки — это искусственно созданные языки для профессионального применения. Они, как правило, носят международный характер и имеют письменную форму.

С любым языком связаны следующие понятия:

алфавит — множество используемых символов;

синтаксис — правила записи языковых конструкций (текста на языке);

семантика — смысловая сторона языковых конструкций;

прагматика — практические последствия применения текста на данном языке.

Все названные компоненты языка ориентированы на специфику предметной области применения.

Способ представления данных в техническом устройстве информатики (например, в компьютере) называется языком представления данных в информатике, Информацию, циркулирующую в техническом устройстве, можно разделить на два вида: данные для обработки и управляющие сигналы (команды, программы, операторы).

Для каждого вида различается внешнее и внутреннее представление данных. Внешнее представление ориентировано на человека, определяет вид данных на интерфейсных устройствах технической системы: экран, принтер. Внутреннее представление — это данные на носителях внутри технической системы: памяти, линиях передачи данных.

В самом общем смысле можно сказать, что внутренним языком представления данных технической системы является язык двоичных кодов. Но для разных типов данных и различных типов технических устройств используются различные языки внутреннего представления.

Языки внешнего представления данных обычно приближены к привычной для человека форме: числа представляются в десятичной системе счисления, при записи текстов используются алфавиты естественных языков, традиционная математическая символика и пр.

Внутренним языком представления действий над данными (языком управления техническим устройством) является командный язык, выраженный как язык программирования высокого уровня, или входного языка пакета прикладных программ, или командного языка операционной системы (пользовательской оболочки), или языка манипулирования данными в СУБД и т. д. Следует иметь в виду, что любой язык высокого уровня может включать в себя как средства представления данных (раздел данных), так и средства представления действий над данными (раздел операторов).

3.2 Язык чисел (системы счисления)

Обработка данных техническими средствами информатики предполагает проведение разнообразных вычислений даже при решении задач не связанных с какими-то расчетами. В связи с этим встает вопрос о выборе оптимального представления чисел в техническом устройстве обработки.

Представление чисел в компьютере по сравнению с формой чисел, известной со школы, имеет два важных отличия:

1. Используется двоичная система счисления.

2. Количество разрядов записи числа ограничено.

Любое число имеет значение (содержание) и форму представления.

Значение числа задает его отношение к значениям других чисел (>, <, ═) и, следовательно, порядок расположения чисел на числовой оси.

Форма представления определяет порядок записи числа с помощью предназначенных для этого знаков. При этом значение числа не зависит (инвариантно) от способа его представления, т. е. число может быть записано по разному. В связи с этим возникают вопросы о представления чисел и о возможности и способах перехода от одной формы представления к другой. Способ представления определяется системой счисления.

F Система счисления — это правила образования записи (изображения) чисел с помощью заданного набора специальных знаков — цифр.

Существуют унарная, позиционные и непозиционные системы счисления.

F Унарная система счисления — это система счисления, в которой для записи чисел используется только один знак, например «палочка» —).

F Непозиционная система счисления — каждой цифре в любом месте числа соответствует одно и то же значение — количественный эквивалент.

! Пример: Римская система записи чисел, в которой используются базовые числа: 1 — «I», 5 — «V», 10 — «X», 50 — «L», 100 — «C», 500 — «D», 1000 — «M».

Все другие числа строятся комбинацией базовых в соответствии со следующими правилами:

– если цифра меньшего значения стоит справа от большей цифры, то их значения суммируются; если слева — то меньшее значение вычитается из большего;

– цифры «I», «X», «C» и «M» могут следовать подряд не более трех раз каждая;

– цифры «V», «L», «D» могут использоваться в записи не более одного раза.

Недостатками непозиционных систем счисления являются трудность записи больших чисел и сложность формализации правил проведения арифметических операций.

Унарное и непозиционное представления чисел относятся к аддитивным формам, в которых значение числа определяется операциями сложения и вычитания. В отличии от них позиционные системы счисления относятся к аддитивно — мультипликативным формам, поскольку значение числа в них определяется операциями умножения и сложения.

F Позиционными называются системы счисления, в которых значение каждой цифры в изображении числа определяется ее положением (позицией) в ряду других цифр.

Позиционных систем счисления существует множество и отличаются они друг от друга алфавитом — множеством используемых цифр.

F Алфавитом системы счисления называется совокупность различных цифр, используемых в позиционной системе счисления для записи чисел.

F Основанием системы счисления (величиной алфавита данной системы счисления) называется величина , равная отношению веса любого разряда числа к весу соседнего младшего разряда.

F Базис позиционной системы счисления — это последовательность чисел, каждое из которых задает вес каждого разряда.

Если основание системы счисления обозначить буквой , то базис позиционной системы счисления представляет собой последовательность чисел , где .

Например, для десятичной системы счисления базис представляет ряд цифр:

.

Главная особенность позиционного представления чисел — возможность посредством ограниченного набора знаков (цифр, разделителя целой и дробной частей, обозначения знака) записать неограниченное количество различных чисел.

Сущность позиционного представления чисел отражается в развернутой форме записи чисел. Для произвольной системы счисления с основанием любое число , удовлетворяющее условию , может быть представлено в виде многочлена:

.

Из коэффициентов при степенях основания строится сокращенная запись числа:

.

Посредством несложных преобразований целой и дробной частей числа можно получить развернутую запись числа по схеме Горнера:

– для целой части ;

– для дробной части .

Индекс у числа указывает, что оно записано в системе счисления с основанием p, общее число цифр в дробной части равно , а в целой части — . Все коэффициенты — целые числа, удовлетворяющие условию .

В десятичной системе счисления основание и для записи используется десять цифр— «0», «1», «2», «3», «4», «5», «6», «7», «8», «9». Каждая цифра числа занимает в нем определенный разряд, который имеет соответствующий весовой коэффициент, определяемый числом 10 в степени:

– для разрядов влево от запятой — ;

– для разрядов вправо от запятой — .

Таким образом, запись числа 547,35 в десятичной системе счисления означает

или по схеме Горнера

.

Основное преимущество позиционных систем счисления перед непозиционными — удобство выполнения арифметических операций.