Лекция 1. Введение. Основные понятия информатики.
Научной дисциплиной, изучающей движение, структуру и свойства семантической информации, является информатика. Информатика в определенной степени связана с математической теорией информации, основы которой были разработаны Клодом Шенноном. Более того, методы математической теории информации широко применяются в информатике. Однако следует различать математическую теорию информации и информатику.
Математическая теория информации целиком и полностью отвлекается от содержательной, семантической стороны информации, тогда как в информатике именно эта сторона является наиболее существенной. Информатика, кроме количественных характеристик информации, рассматривает также ее качественную особенность, ее смысловое (семантическое) значение, важность информации для потребителей. В информатике понятие информации ассоциируется со знанием всех присущих ей свойств: старением, достоверностью, соответствием достигнутому научно-техническому уровню и т. д.
Понятие информации весьма широко и многосторонне, поэтому оно имеет целый ряд определений и синонимов: информация - это обозначение содержания, полученного из внешнего мира, до настоящего времени каждая попытка дать универсальное определение информации терпит крах из-за неразрешимости основного вопроса: един ли для всех "приемников" информации предлагаемый критерий отбора из всего множества воздействий материального мира тех и только тех воздействий, которые несут информацию для данного "приемника"?
В настоящее время наиболее распространено убеждение, что такого универсального критерия и, следовательно, универсального определения информации не существует. С этой точки зрения информацией являются все сведения об объекте, полезные "приемнику" (человеку, коллективу, человеко-машинной системе) для решения задачи (достижения цели). Если данные сведения не нужны, они представляют собой "шум", а не информацию. Если данные сведения способствуют принятию неправильного решения, они представляют собой дезинформацию.
Данные представляют собой потенциальную информацию, и с этой точки зрения в информационных системах накапливается не информация, а данные (потенциальная информация). Информацией они становятся лишь по предоставлению их некоторому потребителю. В приведенном определении информация не отождествляется со знаниями. Информация - собрание данных, тогда как знание предполагает постижение действительности сознанием, организующим данные путем их анализа.
Данные могут рассматриваться как признаки или записанные наблюдения, которые по каким-то причинам не используются, а только хранятся. В том случае, если появляется возможность использовать эти данные для уменьшения неопределенности о чем-либо, данные превращаются в информацию. Поэтому информацией являются используемые данные
Информация обладает следующими свойствами:
1. Объективность и субъективность информации:
Понятие объективности информации является относительным, т. к. методы являются субъективными. В ходе информационного процесса степень объективности информации всегда понижается.
2. Полнота информации:
Характеризует качество информации и определяет достаточность данных для принятия решений или для создания новых данных, на основе имеющихся. Пример: Вы прочитали в газете такое сообщение: "Будет дождь". Это неполная информация, т. к. не сказано, когда именно будет дождь. "Завтра после полудня будет дождь" - полная информация.
3. Достоверность информации:
При регистрации сигналов могут появляться не только "полезные" сигналы, но и посторонние сигналы - информационный шум. Если полезный сигнал зарегистрирован более чётко, чем посторонние сигналы, достоверность информации будет более высокой. Чем выше информационный шум, тем ниже достоверность информации. Пример: "Волга впадает в Черное море" - недостоверная информация. "Волга впадает в Каспийское море" - достоверная информация.
4. Адекватность информации:
Это степень соответствия реальному объективному состоянию тела. Неадекватная информация может образоваться при создании новой информации на основе неполных или недостоверных данных. Достоверные данные + неадекватные методы = неадекватная информация
5. Доступность информации:
Мера возможности получить ту или иную информацию. На степень доступности информации влияют одновременно как доступность данных, так и доступность адекватных методов.
6. Актуальность информации:
Это степень соответствия информации текущему моменту времени. Достоверная и адекватная устаревшая информация - неактуальна.
Независимо от сферы деятельности человека выполнение любой работы и решение любой проблемы всегда связано с использованием уже существующей и созданием новой информации. С этой точки зрения любая основная деятельность человека связана с его информационной деятельностью, т. е. с деятельностью по сбору и обработке существующей и созданию новой информации.
Иными словами, информационная деятельность неразрывно связана с основной деятельностью, а субъект основной деятельности (СОД) всегда выполняет три взаимосвязанных функции: потребителя (приемника) информации, собственно исполнителя основной работы (деятельности) и генератора (источника) информации.
Следовательно, понятие информации тесно связано с понятием потребителя (приемника) информации, генератора (источника) информации, информационной потребности и другими понятиями, определяющими степень соответствия информации, полученной потребителем, его информационным потребностям.
Под потребителем (приемником) информации понимают отдельное лицо, коллектив, машинную или человеке - машинную (организационную) систему, использующие информацию/данные в целях выполнения определенной работы в процессе основной деятельности. Иными словами потребителем информации является любой субъект основной деятельности.
В отличие от потребителя информации генератором (источником) информации является отдельное лицо, коллектив, машинная или человеко-машинная система, создающая сообщения в ходе (или в результате) выполнения той или иной деятельности.
Информация имеет разную ценность для субъектов, и при ее оценке выделяют несколько аспектов:
1. Синтаксический – связан со способом представления информации и не зависит от ее семантических и прагматических свойств. На этом уровне рассматриваются формы представления информации. Они зависят от способа хранения, передачи, отображения и преобразования информации. Например – формат сообщений.
2. Семантический – связан со смысловым содержанием информации между словами и другими элементами. Отражает тезаурус или др. словами словарь, который имеет 2 части: список слов и список словосочетаний, которые сгруппированы по смыслу.
3. Прагматический – определяет возможность достижения цели в результате получения информации. Он определяет потребительские свойства информации.
Информационная потребность (ИП) - совокупность элементов информации/данных, необходимая и достаточная для эффективного выполнения заданной работы (решения задач) субъектом основной деятельности. ИП зависит от степени подготовленности СОД к выполнению заданной работы, его знаний, умений, наличия уже собранной информации/данных, а также от трудоемкости и сложности заданной работы, ее внутреннего многообразия и взаимосвязей с внешней средой.
Информационная потребность СОД удовлетворяется в результате поиска сообщений в информационной среде по информационному запросу, сформулированному на естественном языке, и в той или иной мере отражающему информационную потребность. Степень адекватности (соответствия) информационного запроса информационной потребности определяется различными факторами, основным из которых является способность СОД сформулировать свою информационную потребность на естественном языке с учетом специфики как стоящей перед СОД проблемы, так и информационной среды.
Найденные в результате информационного поиска сообщения в только той или иной мере соответствуют информационному запросу и информационной потребности.
Характеристика степени соответствия сообщения информационной потребности носит название пертинентности.
Характеристика степени соответствия сообщения информационному запросу получила название релевантности.
В силу того, что информационный запрос практически никогда не соответствует полно и точно информационной потребности (информационный запрос может быть адекватен информационной потребности только в единственном случае, когда СОД абсолютно полно и точно знает свою информационную потребность и может ее сформулировать, но это может быть только после получения им всей необходимой информации), релевантность информации всегда отличается от ее пертинентности.
Информационная потребность отражает намеченные цели и однозначно определяется решаемыми задачами.
Смысловая релевантность - смысловое соответствие текста (документа, фактографической записи) информационному запросу, предусматривает понимание текстов на естественном языке. Это семантическая операция. Она несет в себе долю неопределенности. Но пользователь должен точно определить свое отношение к результату поиска и определить релевантен или нерелевантен данный текст.
Формальная релевантность - соответствие поискового образа документа поисковому предписанию. Существуют критерии формального и смыслового соответствия. Смысловая и формальная релевантность может отличаться количественно. Построение оценки технических характеристик базируется на эксперименте.