Базы данных и операционные системы.

1.03.2004

16.02.2004

 

В 90-е гг.появилась необходимость своей отраслевой информатики для каждой научной сферы. В Англии – Historical computing keyboarding. В России термин «историческая информатика» был придуман на истфаке в 1991г. в 1992 г. появилась ассоциация «История и компьютер» (АИК).

 

Информация – главный предмет изучения.

!Специфичность! – почти все виды программного обеспечения издавались под бизнес-задачи.

Информационная база для историков - источники→

· неполнота данных,

· неопределенность/размытость,

· зависимость от контекста,

· использование контекста источников.

Специфика информации исторических источников требует особых методов и технологий работы с источниками.

 

Источнико-ориентированные=source-orientated:

1) клио – Kλeώ (придумал профессор Манфред Талер (Геттингенский университет)

2) CensSys (Норвегия) – для работы с историческими переписями (придумал Ян Олдервалл).

3)Fuzzyclasss (разработана в МГУ).

 

В России специализация «историческая информатика» внутри специальности «история» была утверждена в 1998 г.

 

Историческая информатика.

1. предыстория (кон.1960-1980 гг.).

Эра больших ЭВМ.

Разработка статистических программ:

ü для обработки массовых исторических источников,

ü компьютерные методы изучения средневековых текстов,

ü ВИС(программы для восстановления истории семьи),

ü Разработка банков данных. Именно в это время стали формироваться банки исторических данных.

 

2. кон. 1980х-кон1990х. –

Микрокопьютерная революция. На истфаке первый ПК появился в 1988 г.

 

3. Интернет-история. Переворот в области ист. Информатики.

ü Пер.данных,

ü Связ. с объендинением GIS,

ü Биолог.истории,

ü Компьютерное моделирование исторических процессов.

 

HARDWARE

 

Первый ПК – 1974 г.

 

Главные компоненты:

§ Процессор

§ Запоминающее устройство (для хранения информации)

§ Устройство ввода-вывода (для взаимодействия человека и компьютера)

 

Единицы измерения информации.

Самая маленькая единица измерения - бит. Бит – элемент единицы информации.

 

      22   21   20  

 

С помощью трех разрядов-битов можно закодировать от 0 до 7 т.е. 8 чисел.

 

 

Следующая.единица – байт. Байт это 8-битная последовательность. С помощью одного байта можно отобразить 256 различных символов →

 

23=8

24=16

25=32

26=64

27=128

28=256

 

Байтами измеряется память.

Килобайт(Кб)=1024 байта

Мегабайт(Мб)=1024 Кб≈1000000 байт

Гигабайт(Гб)=1024 Мб≈1 млрд. байт

Терабайт(Тб)=1024 Гб

 

Существует 2 вида памяти ПК:

Ø Оперативная память – RAM (Random Access Memory) – cлужит для текущих вычислений в компьютере.

Ø Винчестер – Hard disk – хранит основное программное обеспечение (ср.-80гб).

 

Другие виды памяти:

Ø Дискеты (floppy disk) = 1,44Мб≈1000стр.текста

Ø Лазерные оптические диски. Ранее были широко распространены CD-ROM (Read Only Memory), чей объем составлял 700Мб. Теперь – CD-RW(recordable)-допускают перезапись.

Ø Flash-карта с USB-разъемом. Емкость составляет до 1 Гб. Высокая скорость переписывания.

Ø Магнитные диски. Объем записанной информации может составлять до нескольких Гб. « - « -очень тяжелые.

Ø DVD-Rom (Digital Video Disk). Ориентирован на хранение видеоинформации в оцифрованном формате. Емкость составляет 650-700 Мб (примерно 500 дискет). Самый большой – 17 Гб (20 часов).

Процессор

-электронная схема, которая задает тактовую частоту ПК.

 

Единица измерения циклических процессов – Герц.

Кг = 1000 Герц

Мг = 1000000 Герц

Гг = 1 млрд Герц

 

Элементарная операция не есть арифметическое действие; это взятие числа из его ячейки для дальнейших операций с ним.

 

Устройства ввода-вывода:

§ Клавиатура

§ Монитор

§ Мышь

§ Принтеры: матричные, струйные, лазерные.

§ Сканеры. Их разрешающая способность измеряется в ед. dpi (dot per inch). Бывают планшетные и ручные.

§ Дигитайзеры-устройства для создания компьютерных карт.

§ Компьютерные сети:

- Локальные(сервер-центр. компьютер, у него есть два дублирующих друг друга винчестера)

- Глобальные (Интернет).

 

Каналы связи:

o Модем(позволяет наладить связь между компьютером и телефонной линией)

o Сетевой кабель. Сетевая карта соединяет компьютер с сетевым кабелем.

 

Существует три вида кабеля:

- Коаксиальный кабель(10 Мбит/с)-самый слабый.

- Витая пара (100 Мбит/с).

- Оптоволоконные кабели (10 Гб/с)-оптическое волокно по которому со скоростью света распространяются сигналы.

 

К низшему типу программного обеспечения относятся программы, встроенные в электронную схему ПК. Каждый компьютер оснащен специфическим для выпускающей его фирмы программным обеспечением, хранящемся на жестком диске. BIOS (basic input output system) реализует все базовые функции ввода-вывода информации. Эти программы играют роль своеобразного толкования приказов для аппаратуры.

 

Программное обеспечение ПК.

ПО – это совокупность всех программ и служебных данных, предназначенных для управления компьютером.

 

Все ПО можно разделить на 2 категории:

o Системное – комплекс программ, обеспечивающих работу компьютера и его готовность использовать прикладные программы.

o Прикладное – все виды конкретных программ, используемых пользователем.

 

Операционная система – ядро ПО. Название: MS-DOS (MicroSoft Disk Operation System).

Начиная с Windows 95, версии Windows стали полноценными операционными системами. Для профессионалов – UNIX. Другая система – LINUX (единая некоммерческая система).

 

Назначение операционной системы – обеспечение высокой эффективности использования системных ресурсов. Операционная система должна оперировать файлами.

Файл – это комплекс целостных фрагментов однородной информации, хранящейся на диске. Файловая система является частью операционной системы. Название любого файла состоит из 2 частей – префикса (имени) и суффикса (его расширения).

 

Корневой каталог:

А:/abc.doc →на диске А(дискета)

 

Физический диск

Логический диск- виртуальное разделение диска на 2 части, чтобы разделить пространство по функциям.

 

СУБД- система управления базой данных- специальное программное обеспечение, предназначенное для хранения, поиска и обработки информации, представленной в формате базы данных.

БД- это однородный материал, внесенный в виде записей в структуру СУБД.

БД- определенный исторический материал. СУБД- программа для его реализации.

Отдел кадров - типичный потребитель СУБД.

 

Исторические БД:

ü Источнико-ориентированные

ü Проблемно-ориентированные

 

ПО подход близок к стандартному. ИОП имеет целью перевести источник в формат БД без потери информации в максимально приближенном к источнику виде.

ПОП предназначено для переноса в БД только той информации, которая необходима для рассматриваемой исследователем проблемы. ИОП позволяет использовать БД разными исследователями для решения разных задач, в то время как ПОП может использоваться только для определенного круга задач, связанных с данной проблематикой. В настоящее время доминирует комбинированный подход к созданию БД.

 

Основные этапы создания исторических БД.

1) Поставить исследовательскую задачу. Существует 2 типа задач:

o Создание БД

o Исследование проблемы на основе БД

2) Определить комплекс источников по этой проблематике.

3) Определить структуру БД. – выбрать, какие информационные поля войдут в структуру БД. Структуризация материала является важной частью работы.

4) Перенос информации из источника в структуру БД

5) Внесение записей в БД. Каждый объект это запись.

6) Выполнение задач информационного поиска.

7) Аналитические задачи. Задачи информационного поиска лучше делать по источнико-ориентированным полям, а аналитические задачи – по категориальным полям.

 

Самая распространенная СУБД – Access: 90% всех БД создаются в нем. Она относится к несетевым СУБД.

Сетевые (к таким можно применять ← СУБД →несетевые режим On-line поиска информации)

Access относится к реляционным СУБД. Реляцио (лат.) - отношение. Это самый распространенный тип СУБД на сегодняшний день. Реляционные СУБД имеют табличную структуру. Главная таблица связывает отдельные блоки информации.

Смысл табличной структуры реляционной БД: в каждой таблице экономно размещается информация о данном аспекте. Ключевое поле это уникальное поле, которое может встречаться только для данной записи, оно служит для идентификации каждой записи.