Система регистрации речи диспетчерских переговоров

Министерство образования РФ

Факультет                                                           К защите

Специальность                                                     Зав. кафедрой_____________

                                                                    

                                                                                        “____”_____________200   г.

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА

к дипломной работе на тему

                Система регистрации речи диспетчерских переговоров.

Дипломник_______________________                     (______________________)  

                             

Руководитель  работы_______________                    (______________________)

                  

Консультант по

Экономической части_______________                    (_______________________)

Консультант кафедры_______________                    (_______________________)

“___16___”____июня_______________2005   г.

Die Inhaltsangabe.

Das gegebene Diplomprojekt betrachtet das Problem des Registrierunges der Rede in den Dispatcherverhandlungen. Das Programm ist mit der Nutzung der Programmiersprache - Delphi7, des Programminterfaces Telefonie (TAPI) entwickelt. Es wird auch das Untersystem der Kompression des Lautes verwendet, das den Anwendungen den Satz der Servicemittel für das Umwandeln der lautlichen Formate und anderer Arten der Bearbeitung der lautlichen Daten gewährt. Das System des Registrierunges der Rede funktioniert unter Leitung des Betriebssystemes Windows XP und bei Vorhandensein von dem Mechanismus BDE für die Arbeit mit den Datenbasen.

Содержание

 TOC \o "1-3" \n 1   Введение. Технико-экономическое обоснование темы........................... 7

2   Обзор форматов преобразования звуковых данных.................................. 15

2.1      Отличия цифрового представления сигналов от аналогового................................ 15

2.2      Способы представления звука в цифровом виде.......................................................... 17

2.3      Особенности восприятия речевых данных человеком.............................................. 20

2.4      Диспетчер сжатия звука.................................................................................................... 21

2.5      Универсальные кодеки...................................................................................................... 22

2.6      Кодеки для сжатия только речи....................................................................................... 37

2.7      Рекомендации по выбору форматов................................................................................ 40

3   Программная реализация системы регистрации речи диспетчерских переговоров............................................................................................................................... 42

3.1      Общее описание программного обеспечения реализующего разработанный алгоритм        42

3.2      Программный интерфейс телефонии (TAPI).................................................................. 46

3.3      Обработка звуковых файлов в Windows........................................................................ 54

3.4      Подсистема сжатия звука в Windows............................................................................ 65

3.5      Работа с базами данных в DELPHI.................................................................................. 86

3.6      Система регистрации речи диспетчерских переговоров............................................ 95

4   Экспериментальная часть........................................................................................ 103

5   Экономическая часть................................................................................................. 105

5.1      План выполнения НИР..................................................................................................... 105

5.3      Составление сметы затрат и определение цены на НИР.......................................... 106

5.3      Оценка экономической эффективности НИР............................................................ 110

6   Безопасность и экологичность проекта........................................................ 111

6.1      Вступление......................................................................................................................... 111

6.2      Анализ опасных и вредных факторов, воздействующих на разработчика при разработке данной системы......................................................................................................................................... 112

6.2.1         Микроклимат рабочей зоны разработчика............................................................ 113

6.2.2         Освещение рабочего места...................................................................................... 114

6.2.3         Воздействие шума на разработчика. Защита от шума........................................ 115

6.2.4         Опасность повышенного уровня напряженности электромагнитного поля.....

…………………............................................................................................................................... 116

6.2.5         Электробезопасность. Статическое электричество........................................... 118

6.3      Организация рабочего места разработчика................................................................ 119

6.4      Анализ пожарной безопасности.................................................................................... 121

6.5      Расчет искусственного освещения............................................................................. 124

7   ЗаКЛЮЧЕНИЕ........................................................................................................................ 128

Список литературы............................................................................................................ 129

Приложение 1................................................................................................................................ 132

1          

В связи с развитием рыночных отношений в России и необходимостью сокращения разрыва в технологическом отставании России от западных стран, актуальным становится эффективное использование новых информационных технологий. Информационный бизнес, являясь составной частью бизнеса, придает общее ускорение развитию экономики.

На экономику предприятий, связанных с эксплуатацией вычислительной техники и программного обеспечения влияют несколько факторов. Первый — связан с динамическими изменениями в среде пользователей продуктов и услуг. В новых условиях пользователи экономно относятся к средствам, рационально стараются пользоваться услугами вычислительных центров. Второй — массовое использование персональных ЭВМ, которые существенным образом изменили структуру парка ЭВМ и программного обеспечения. Третий — изменение формы собственности предприятий, тем самым изменилась ситуация на информационном рынке. Четвертый — зародившийся и развивающийся рынок программных продуктов и услуг.

В результате влияние этих факторов возникает как следствие повсеместное распространение персональных ЭВМ, и сопутствующих им компьютерных составляющих и принадлежностей (модемы, принтеры, сканеры и т. д.), а также программных продуктов обслуживающих эту технику или решающую иные производственные и экономические задачи (ОС Windows, программы 1C, Adobe Photoshop и т.д.).

Если в качестве предприятия выступает таксопарк, то появляется много производственных и экономических задач которые возможно решить с помощью технических и программных средств. Рассмотрим одну из таких задач.

В любом таксопарке есть диспетчеры, которые принимают звонки (заказы) от клиентов. Начальнику может понадобиться выяснить, кто именно из диспетчеров принимал звонок (заказ) от клиента в конкретный день или в конкретное время, а также прослушать, что это был за заказ, представляющий собой звуковое сообщение (разговор диспетчера с клиентом). Итак, возникает такая задача: диспетчер должен отчитаться за требуемый период и в случае необходимости предоставить суть заказа в конкретное время.

Решение задачи можно выразить в следующих рекомендациях:

1)      Определить технические средства необходимые для решения данной задачи

2)      Определить программные средства

3)      Разработать алгоритм программной реализации этой задачи

4)      А также решить сопутствующую проблему сжатия звуковых данных

Разберем эти этапы более подробно.

1)                                Совершенно ясно, что необходим компьютер. Говорить о таких составляющих компьютера как процессор, объем оперативной памяти, емкость диска практически не приходится, так как мощность современных компьютеров растет огромными темпами. Так что можно  лишь в качестве рекомендации указать конфигурацию, при которой тестировалась описанная ниже программа: процессор Athlon 1000, объем оперативной памяти 128Mb, емкость диска 80Gb.

         Когда появились устройства передачи и приема данных через телефонные линии, модемы, разработчики "внедрили" способность приема и передачи звука и в эти устройства. Это результат обычного стремления совместить как можно больше функциональных возможностей в одном устройстве. Модем должен поддерживать голосовые функции на аппаратно-программном уровне.

         Определить, голосовой модем или нет, можно по наличию слова Voice в названии модема. Если такового термина нет или по ряду причин определение затруднительно, то можно "опознать" модем по внешним признакам, например по наличию разъемов SPK и MIC. Они предназначены для подключения телефонной гарнитуры (наушники с микрофоном) или просто микрофона и активной акустической системы. Голосовые модемы можно разделить на две категории с функцией Speakerphone или Hands free и без этой функции.

          Модем, поддерживающий функцию Speakerphone или Hands free (переводится это как "громкоговоритель" или "свободные руки", что, в принципе, означает одно и то же), позволяет не только воспроизводить звук в телефонной линии и в режиме автоответчика записывать звук из нее, но и использовать модем как обычный телефонный аппарат. Это удобно для оператора, отвечающего, к примеру, на телефонные звонки, которому при этом необходимо вести записи (прием объявлений, телефонограмм), работать с компьютером (справочная служба и т. д.), в общем, нуждающемся в том, чтобы руки были свободны, а придерживаемая плечом (в большинстве случаев) телефонная трубка не стесняла движений.

          Итак,  для работы компьютера с телефонной сетью, по которой клиент связывается с диспетчером необходим  голосовой модем.

 

       

                                                             Рис.1

         Модем ACORP M-56EMSF-2 (рис.1) создан специально для максимально надёжной и быстрой работы. Производители использовали весь свой накопленный опыт и учли все особенности эксплуатации подобных модемов в российских условиях. И из ниже приведенных характеристик видно, что он подходит для нашей задачи.

Поддержка всех основных протоколов передачи данных:

·         ITU-T V.92

·         ITU-T V.90

·         ITU-T V.34+

·         ITU-T V.34

·         ITU-T V.32b

·         ITU-T V.32

·         ITU-T V.23C

·         ITU-T V.22B

·         ITU-T V.22

·         ITU-T V.21

·         ITU-T BEL 212

·         ITU-T BEL 103

Протокол коррекции ошибок V.42 Протокол коррекции ошибок MNP4 Протокол сжатия данных MNP5 Протокол сжатия данных V.42bis Протокол сжатия данных V.44 (максимально возможный размер словаря компрессии).

Работа с факсом:

·         Класс передачи факсовых сообщений Class 1,1.0,2

·         Поддерживаемые протоколы согласно стандарту ITU-T: V.17, V.26ter, V.27ter, V.29

·         Возможность принимать \ передавать факсимильные сообщения на обычный факсимильный аппарат.

Голосовые возможности:

·         Автоматический прием голосовых и факсимильных сообщений аппаратным способом.

·         Модем поддерживает все основные «голосовые» функции, реализация спикерфона (работа в режиме телефона) максимально упрощена. Для этого достаточно подключить микрофон и наушники к специальным гнёздам.

·         Поставляемое в комплекте ПО превратит ваш компьютер с установленным модемом в полноценный автоответчик, электронный секретарь. Причем Вы без труда сможете управлять вашим «голосовым» офисом, с помощью тонального набора, даже находясь вдали от дома или офиса.

Особенности модема:

·         Уровень выходного сигнала от -0 до –15db

·         Регулировка скорости передачи данных и «сверху» и «снизу».

·         100% настройка сигнала «Линия занята»

·         Повышенная чувствительность приемника.

·         Расширенная индикация состояния модема.

·         Бесшумный набор номера в импульсном режиме.

·         Дополнительное гнездо для подключения параллельного телефона

         Все модемы Acorp 56К адаптированы к российским телефонным линиям и отлично распознают сигналы ATC.

         Выбор звуковой карты для проигрывания звука влияет лишь на качество воспроизведения, а, следовательно, можно воспользоваться и звуковой картой, встроенной  в материнскую плату компьютера, ставшей практически стандартом (например, C-Media).

         Выбор телефонной гарнитуры (наушники с микрофоном) также произвольный и зависит от того в каком качестве обслуживания заинтересован пользователь.

Итак, схема соединения технических средств выглядит так:

Звуковая карта

Микрофон

Телефонная сеть

Наушники

Модем

ПЭВМ

                                                              Рис.2

2)                      Для взаимодействия технических средств и реализации поставленной задачи необходимы программные средства:

Операционная система (ОС) устанавливаемая  на компьютере - это важнейшая часть системного программного обеспечения, которая организует процесс выполнения задач, распределяя для этого ресурсы рабочей станции, управляя работой всех ее устройств и взаимодействием с пользователем. ОС Windows имеет наибольшее распространение, и большинство современных предприятий ориентированы на это семейство ОС. Будем использовать ОС WindowsXP – последняя выпущенная версия ОС Windows  на текущий момент компанией Microsoft.

А также язык программирования для создания программной реализации поставленной задачи. Язык программирования Delphi - это комбинация нескольких важнейших технологий:

·         Высокопроизводительный компилятор в машинный код

·         Объектно-ориентированная модель компонент

·         Визуальное (а, следовательно, и скоростное) построение приложений из программных прототипов

·         Масштабируемые средства для построения баз данных

Будем использовать Delphi 7.0.

И, наконец, 3 и 4 этапы являются целью данной работы – необходимо составить алгоритм обслуживающий предоставленные технические средства и удовлетворяющий параметрам поставленной задачи. А также решить возникающую при записи заказа (разговора) проблему сжатия звуковых данных для экономии свободной емкости диска.

2           Обзор форматов преобразования звуковых данных

           2.1  Отличия цифрового представления сигналов от аналогового

Традиционное аналоговое представление сигналов основано на подобии (аналогичности) электрических сигналов (изменений тока и напряжения) представленным ими исходным сигналам (звуковому давлению, температуре, скорости и т.п.), а также подобии форм электрических сигналов в различных точках усилительного или передающего тракта. Форма электрической кривой, описывающей (также говорят - переносящей) исходный сигнал, максимально приближена к форме кривой этого сигнала.

Такое представление наиболее точно, однако малейшее искажение формы несущего электрического сигнала неизбежно повлечет за собой такое же искажение формы и сигнала переносимого. В терминах теории информации, количество информации в несущем сигнале в точности равно количеству информации в сигнале исходном, и электрическое представление не содержит избыточности, которая могла бы защитить переносимый сигнал от искажений при хранении, передаче и усилении.

Цифровое представление электрических сигналов призвано внести в них избыточность, предохраняющую от воздействия паразитных помех. Для этого на несущий электрический сигнал накладываются серьезные ограничения - его амплитуда может принимать только два предельных значения - 0 и 1.

Вся зона возможных амплитуд в этом случае делится на три зоны: нижняя представляет нулевые значения, верхняя - единичные, а промежуточная является запрещенной - внутрь нее могут попадать только помехи. Таким образом, любая помеха, амплитуда которой меньше половины амплитуды несущего сигнала, не оказывает влияния на правильность передачи значений 0 и 1. Помехи с большей амплитудой также не оказывают влияния, если длительность импульса помехи ощутимо меньше длительности информационного импульса, а на входе приемника установлен фильтр импульсных помех.

Сформированный таким образом цифровой сигнал может переносить любую полезную информацию, которая закодирована в виде последовательности битов - нулей и единиц; частным случаем такой информации являются электрические и звуковые сигналы. Здесь количество информации в несущем цифровом сигнале значительно больше, нежели в кодированном исходном, так что несущий сигнал имеет определенную избыточность относительно исходного, и любые искажения формы кривой несущего сигнала, при которых еще сохраняется способность приемника правильно различать нули и единицы, не влияют на достоверность передаваемой этим сигналом информации. Однако в случае воздействия значительных помех форма сигнала может искажаться настолько, что точная передача переносимой информации становится невозможной - в ней появляются ошибки, которые при простом способе кодирования приемник не сможет не только исправить, но и обнаружить. Для еще большего повышения стойкости цифрового сигнала к помехам и искажениям применяется цифровое избыточное кодирование двух типов: проверочные (EDC - Error Detection Code, обнаруживающий ошибку код) и корректирующие (ECC - Error Correction Code, исправляющий ошибку код) коды.

Цифровое кодирование состоит в простом добавлении к исходной информации дополнительных битов и/или преобразовании исходной битовой цепочки в цепочку большей длины и другой структуры. EDC позволяет просто обнаружить факт ошибки - искажение или выпадение полезной либо появление ложной цифры, однако переносимая информация в этом случае также искажается; ECC позволяет сразу же исправлять обнаруженные ошибки, сохраняя переносимую информацию неизменной. Для удобства и надежности передаваемую информацию разбивают на блоки (кадры), каждый из которых снабжается собственным набором этих кодов.

Кроме целей помехозащиты, информация в цифровом сигнале может быть подвергнута также линейному или канальному кодированию, задача которого - оптимизировать электрические параметры сигнала (полосу частот, постоянную составляющую, минимальное и максимальное количество нулевых/единичных импульсов в серии и т.п.) под характеристики реального канала передачи или записи сигнала.

Полученный несущий сигнал, в свою очередь, также является обычным электрическим сигналом, и к нему применимы любые операции с такими сигналами - передача по кабелю, усиление, фильтрование, модуляция, запись на магнитный, оптический или другой носитель и т.п. Единственным ограничением является сохранение информационного содержимого - так, чтобы при последующем анализе можно было однозначно выделить и декодировать переносимую информацию, а из нее - исходный сигнал.

       2.2  Способы представления звука в цифровом виде

        Исходная форма звукового сигнала - непрерывное изменение амплитуды во  времени - представляется в цифровой форме с помощью "перекрестной  дискретизации" - по времени и по уровню.

Согласно теореме Котельникова, любой непрерывный процесс с ограниченным спектром может быть полностью описан дискретной последовательностью его мгновенных значений, следующих с частотой, как минимум вдвое превышающей частоту наивысшей гармоники процесса; частота Fd выборки мгновенных значений (отсчетов) называется частотой дискретизации.

Из теоремы следует, что сигнал с частотой Fa может быть успешно дискретизирован по времени на частоте 2Fa только в том случае, если он является чистой синусоидой, ибо любое отклонение от синусоидальной формы приводит к выходу спектра за пределы частоты Fa. Таким образом, для временной дискретизации произвольного звукового сигнала (обычно имеющего, как известно, плавно спадающий спектр), необходим либо выбор частоты дискретизации с запасом, либо принудительное ограничение спектра входного сигнала ниже половины частоты дискретизации.

Одновременно с временной дискретизацией выполняется амплитудная - измерение мгновенных значений амплитуды и их представление в виде числовых величин с определенной точностью. Точность измерения (двоичная разрядность N получаемого дискретного значения) определяет соотношение сигнал/шум и динамический диапазон сигнала (теоретически это - взаимно-обратные величины, однако любой реальный тракт имеет также и собственный уровень шумов и помех).

Полученный поток чисел (серий двоичных цифр), описывающий звуковой сигнал, называют импульсно-кодовой модуляцией или ИКМ (Pulse Code Modulation, PCM), так как каждый импульс дискретизованного по времени сигнала представляется собственным цифровым кодом.

Чаще всего применяют линейное квантование, когда числовое значение отсчета пропорционально амплитуде сигнала. Из-за логарифмической природы слуха более целесообразным было бы логарифмическое квантование, когда числовое значение пропорционально величине сигнала в децибелах, однако это сопряжено с трудностями чисто технического характера.

Временная дискретизация и амплитудное квантование сигнала неизбежно вносят в сигнал шумовые искажения, уровень которых принято оценивать по формуле 6N + 10lg (Fдискр/2Fмакс) + C (дБ), где константа C варьируется для разных типов сигналов: для чистой синусоиды это 1.7 дБ, для звуковых сигналов - от -15 до 2 дБ. Отсюда видно, что к снижению шумов в рабочей полосе частот 0..Fмакс приводит не только увеличение разрядности отсчета, но и повышение частоты дискретизации относительно 2Fмакс, поскольку шумы квантования "размазываются" по всей полосе вплоть до частоты дискретизации, а звуковая информация занимает только нижнюю часть этой полосы.

В большинстве современных цифровых звуковых систем используются стандартные частоты дискретизации 44.1 и 48 кГц, однако частотный диапазон сигнала обычно ограничивается возле 20 кГц для оставления запаса по отношению к теоретическому пределу. Также наиболее распространено 16-разрядное квантование по уровню, что дает предельное соотношение сигнал/шум около 98 дБ. В студийной аппаратуре используются более высокие разрешения - 18-, 20- и 24-разрядное квантование при частотах дискретизации 56, 96 и 192 кГц. Это делается для того, чтобы сохранить высшие гармоники звукового сигнала, которые непосредственно не воспринимаются слухом, но влияют на формирование общей звуковой картины.

Для оцифровки более узкополосных и менее качественных сигналов частота и разрядность дискретизации могут снижаться; например, в телефонных линиях применяется 7- или 8-разрядная оцифровка с частотами 8..12 кГц.

Представление аналогового сигнала в цифровом виде называется также импульсно-кодовой модуляцией (ИКМ, PCM - Pulse Code Modulation), так как сигнал представляется в виде серии импульсов постоянной частоты (временная дискретизация), амплитуда которых передается цифровым кодом (амплитудная дискретизация). PCM-поток может быть как параллельным, когда все биты каждого отсчета передаются одновременно по нескольким линиям с частотой дискретизации, так и последовательным, когда биты передаются друг за другом с более высокой частотой по одной линии.

  2.3   Особенности восприятия речевых данных человеком.

   Некоторые факты о восприятии звука

·         Частотный спектр воспринимаемый человеком (примерно) от 20 Hz до 20 kHz, наибольшая чувствительность в диапазоне от 2 до 4 KHz.

·         Динамический диапазон (от самых тихих воспринимаемых звуков до самых громких) около 96 dB (более чем 1 к 30000 по линейной шкале).

·         Общеизвестно, что человек в состоянии различить изменение частоты на 0.3% на частоте порядка 1kHz.

·         Если два сигнала различаются менее чем на 1дб по амплитуде - они трудноразличимы. Разрешение по амплитуде зависит от частоты, и наибольшая чувствительность наблюдается в диапазоне от 2 до 4 KHz.

·         Пространственное разрешение (способность к локализации источника звука) - до 1 градуса.

·         Звуки различной частоты распространяются в воздухе с разной скоростью. В результате высокочастотная часть спектра от источника находящегося на удалении от слушателя несколько запаздывает.

·         Человек не в состоянии заметить внезапное исчезновение высоких частот, если оно не превышает порядка 2ms.

·         Некоторые исследования показывают, что человек в состоянии ощущать частоты выше 20kHz. С возрастом частотный диапазон сужается.

    Речь:

·         Частотный спектр, несущий информацию в человеческой речи: от 500 Hz до 2 kHz

o    Низкие частоты - басы и гласные

o    Высокие частоты - согласные

·         Лучшее сжатие речи достигается с использованием параметрических кодеров (LPC, CELP, и пр.), пытающихся представить речь как набор параметров некоторой речевой модели. Кодеки общего назначения (MPEG и др.), как правило, дают худшее сжатие.

   2.4   Диспетчер сжатия звука

         Во всех версиях Windows (начиная с Windows 95) присутствует специальный интерфейс, предназначенный для преобразования форматов звуковых данных. Он называется Audio Compression Manager (ACM), диспетчер сжатия звука. Этот интерфейс позволяет изменять частоту, разрядность, количество каналов, а также тип сжатия звуковых данных (format tag). При достаточной мощности процессора преобразование с успехом может выполняться в реальном времени. ACM включает в себя набор кодеков, которые, собственно, и выполняют необходимые преобразования. Кодек, компрессор/декомпрессор, - исполняемый файл с расширением *.acm. Они находятся в системной папке \Windows\system. Как правило, кодек позволяет осуществить не только сжатие, но и распаковку звуковых данных, т. е. восстановление исходного сигнала РСМ. (Хотя существуют кодеки только для воспроизведения). Пользователь может самостоятельно удалять ненужные ему кодеки, и может самостоятельно установить новые, что придает системе гибкость. После установки кодека все программы, пользующиеся системой ACM, получают возможность работать с этим форматом звуковых данных. Приложения непосредственно взаимодействуют только с диспетчером, который выбирает нужные драйверы, передает информацию между приложением и драйверами, и выполняет прочие функции по координации работы подсистемы

        Практически все серьезные звуковые программы осуществляют преобразование форматов средствами интерфейса Audio Compression Manager (ACM): это и звуковые редакторы (Sound Forge, Cool Edit, Gold Wave и др.); и конвертеры (Wave Convert PRO); и проигрыватели звуковых файлов. WinAmp, например, с настройкой по умолчанию воспроизводит файлы с расширением *.mp3 через свой внутренний декодер, так называемый NullSoft MPEG Audio Decoder, а файлы с расширением *.wav - через систему ACM, даже если в них тот же самый MP3.

        Дальше идет обзор наиболее распространенных кодеков системы Audio Compression Manager (ACM) и определены те области, в которых их применение могло бы быть оправданным и эффективным.

 2.5   Универсальные кодеки

            Под универсальностью подразумевается, прежде всего, пригодность для кодирования сигнала произвольной формы (например, музыки), сохраняя, насколько это возможно, все оттенки и особенности оригинала. Напротив, сжатие речи имеет целью только передачу смысла сообщения. Идеальный компрессор речи преобразовывал ее бы в текст, аналогично тому, как программы оптического распознавания символов преобразуют картинку в текст. По мере своего развития голосовые компрессоры неотвратимо приближаются к этому идеалу. Естественно, попытка сжать музыку компрессором, предназначенным для сжатия речи, приведет к тому, что от музыки просто ничего не останется. Яркий пример универсального формата - широко известный MP3. Он работает на особенностях слухового восприятия человека, не предъявляя жестких требований к структуре входного сигнала, соотношению частот и т. п. Речевые кодеки (например, Voxware MetaVoice) имеют значительно большую степень сжатия, однако удовлетворительное качество достигается только на сигналах, имеющих определённую структуру, то есть речевых. Рассмотрим эти два семейства форматов отдельно.

1) MPEG

         Первый вариант стандарта группы MPEG (Motion Pictures Experts Group) появился в далеком 1992 году. Это был довольно несовершенный стандарт, предназначался он для сжатия видео и звука при спутниковом и кабельном цифровом вещании. О компьютерах и интернете тогда никто и не думал. Параметры этого стандарта (аудио): 48, 44.1, 32 КГц, mono, dual (два моно канала), стерео, интенсивное стерео (объединяются сигналы с частотой выше 2000 Гц.), m/s stereo (один канал переносит сумму - другой разницу).

Позже стандарт MPEG-1 был немного расширен и стал называться MPEG-2:

  •  Появились новые виды частот 16, 22.05, 24 КГц.
  • Поддержка многоканальности - возможность иметь 5 полноценных каналов (left, center, right, left surround, right surround) + 1 низкочастотный (subwoofer).
  • Появился AAC (Advanced Audio Coding - прогрессивное кодирование звука), стандарт - обеспечивает очень высокое качество звука со скоростью 64 kbps per channel (килобит в сек. на канал), возможно использовать 48 основных каналов, 16 низкочастотных каналов для звуковых эффектов, 16 многоязыковых каналов и 16 каналов данных. До 16 программ может быть описано используя любое количество элементов звуковых и других данных. Для AAC существуют три вида профиля - Main (используется, когда нет лишней памяти), Low Complexity (LC), Scalable Sampling Rate (SSR, требуется декодер с изменяемой скоростью приема данных).

 MPEG Layer-3 Audio Codec for MSACM

         Данный продукт разработан в немецком институте имени Фраунхофера - Fraunhofer Institut Integrierte Schaltungen IIS. Первоначально этот кодек был неотъемлемой частью программы MPEG Layer-3 Producer. Но теперь он распространяется сам по себе, в виде файла I3enc.exe размером 294 Кбайт. Встречается так же версия, названная "Fraunhofer MP3 Codec v1.063 (Radium Optimized)", в виде файла SetupI3c.exe размером 870 Кбайт. Обе версии функционально практически одинаковы.

          На входе кодек воспринимает поток PCM, имеющий частоты дискретизации, перечисленные ниже в таблице1. Разрядность потока всегда должна быть 16 бит (это правило справедливо и для большинства других кодеков, 8-ми битная разрядность практически не применяется). Кодек работает как в стерео режиме, так и в моно. В таблице1 указана скорость потока сжатого звука и место, которое займет такая звукозапись в моно режиме (для стерео надо умножить значения на два).

Таблица1

_____________________________________________________________________

частота                   скорость               сколько займет 1 час

дискретизации,            потока,                (приблизительно),

Hz                        kbit/s                  Mb

_____________________________________________________________________

48 000                     64                      28,125

                           56                      24,6

                           48                      21

_____________________________________________________________________

41 100                     64                      28,128

                           56                      24,6

                           48                      21

_____________________________________________________________________

32 000                     64                      28,128

                           56                      24,6

                           48                      21

_____________________________________________________________________

24 000                     32                      14

                           24                      10

_____________________________________________________________________

22 050                     32                      14

                           24                      10

_____________________________________________________________________

16 000                     32                      14

                           24                      10

                           20                      8,5

                           18                      8

                           16                      7

_____________________________________________________________________

12 000                     20                      8,5

                           18                      8

                           16                      7

                            8                      3,5

_____________________________________________________________________

11 025                     20                      8,5

                           18                      8

                           16                      7

                            8                      3,5

_____________________________________________________________________

8 000                      16                      7

                            8                      3,5

_____________________________________________________________________

          Заметим, что сжатие сигнала в реальном времени с качеством AUDIO CD - то есть 44100 Hz, 128 kbit/s, stereo, требует процессора не слабее Celeron 300A. При этом процессор будет полностью загружен и работать с другими приложениями станет практически невозможно. При уменьшении частоты дискретизации требования к процессору пропорционально снижаются. MP3 - один из самых "тяжелых" форматов по требованиям к процессору.

         Особенность всей продукции Fraunhofer IIS - упорное игнорирование режима переменного битрета - VBR. Качество звука, получаемое при использовании этого кодека принято считать эталонным. Оно очень высокое, особенно если воспроизводить файлы через него же. Особо не рекомендуется смешивать продукцию разных фирм - сжимать, например, Xing Encoder'ом или Lame, а слушать через Fraunhofer IIS. Стандарты стандартами, но частотная коррекция в этих кодеках делается по-разному.

В комплект Windows Media Tools от Microsoft'а входит кодек, который называется MPEG Layer-3 Audio Codec (advanced). Его отличие от рассмотренной выше версии professional в том, что advanced - это урезанная, бесплатная демо-версия кодека, она поддерживает только частоты 24 000,   

12000, 16 000 и 8 000 Hz. LAME ACM MP3 CODEC

        Lame - продукт бесплатный, распространяется в виде исходных текстов. Разрабатывается он группой энтузиастов, что не могло не отразиться на качестве, и особенно на стабильности его работы. Как следствие, Lame можно рекомендовать для сжатия голосовой информации. Особо ценен в этом контексте режим VBR, при котором кодек уменьшает скорость передачи в некритичных местах - например, в паузах между словами.

        В Lame появился режим заказного (среднего) битрейта (average bitrate - ABR), реализованный ранее в кодере OGG. По утверждению разработчиков, при одинаковом битрейте кодирование в ABR режиме должно быть не хуже, чем в обычном.

Q-Design realtime MPEG 1 Layer 1,2

         Это тот же MPEG, однако, степень сжатия существенно меньше. Он сжимает примерно в 4-5 раз. Такой же коэффициент сжатия дает MS или IMA ADPCM, но, пожалуй, системные требования ADPCM поменьше будут. Зато Q-Design codec имеет утилиту Speed Control, которая позволяет изменять скорость воспроизведения прямо в процессе воспроизведения. 2) DivX WMA Audio Compressor

        Исправленная версия кодеков Windows Media Audio (WMA), распространяется она в интернете под названием DivX.

        Сетка частот, поддерживаемая кодеком - 48, 44, 32, 22, 16, 11, 8 kHz, для каждой частоты предлагается несколько (до семи) скоростей потока. Частоты 24 и 12 kHz не поддерживаются. Качество звука достаточно лишь для синтетической музыки (попса, танцевальная, техно...). Акустика звучит неадекватно. Очень хорошо этот кодек подходит для записи лекций, совещаний, разговорных передач на FM. Разборчивость речи стабильно 100-процентная.

3) WMА

        WMA - это детище широко известной в мире компании Microsoft. Но все ли знают, как он к этой самой Microsoft попал? История происхождения формата WMA объясняет некоторые интересные особенности его звучания.

          В 1998 году компания Voxware присоединилась к проекту TwinVQ и в его составе участвовала в разработке формата VQF. Компания отделилась от проекта и на основе разработок VQF создала новый формат, получивший название Voxware Audio Codec 4.0. Он стал первым алгоритмом сжатия, обеспечивающим качество 128Кб/с MP3-файлов при цифровом потоке в 64Кб/c. Заметив его высокие характеристики при кодировании речевых сигналов, крупные телефонные компании заинтересовались новой разработкой и даже стали устанавливать ее на свои цифровые АТС. Вскоре свой взор на продукты компании обратила и Microsoft, включив поддержку Voxware Audio Codec в свой Media Player. Дальше все пошло по отработанному уже сценарию: Microsoft покупает Voxware и финансирует доработку формата, получившего впоследствии имя Windows Media Audio. Главный вывод - WMA является, чуть ли не прямым потомком формата VQF, так что понятно, откуда появились его достоинства и проблемы.

         Итак, по заявлениям разработчиков, WMA версии 7 выдает качество, не уступающее 128Кб/c MP3-файлу при сжатии 64Кб/c. Сравнению подверглись закодированные именно в таком сжатии файлы. В ней, кроме считки и бита, играет шикарный симфонический оркестр, записанным с очень высоким качеством. Для компрессии в MP3 была использована программа Audioactive Production Studio. Прослушанные на четырех различных системах, начиная от десятидолларовых офисных колонок, подключенных к безымянной звуковой плате, и заканчивая студийными акустическими мониторами Event, подключенными через усилитель Onkyo к ProTools MixOne посеребренными проводами, был поставлен диагноз: идентичны. Разумеется, профессиональные колонки выдали характерные особенности разных форматов - звучание действительно разное, но общее качество оказалось примерно на одном уровне. И это при том, что файл WMA был вдвое меньше MP3... Впрочем, все это вовсе не значит, что при компрессии 64Кб/с в WMA вы получите приемлемый звук, как это заявлено в красочных пресс-релизах. Он просто не хуже 128Кб/c MP3-файлов, которые сами более чем далеки от идеала.

           Отличительной чертой WMA является полное обрезание звука выше 20КГц, а также непонятное заполнение шумами пауз в композициях. Также WMA довольно груб в обращении с динамическим диапазоном и вносит в него неслабые искажения. Пожалуй, это все выявленные пока недостатки формата. К плюсам же можно смело отнести, во-первых, очень быстрое кодирование файлов, а во-вторых, наилучшее среди современных форматов качество звука при очень сильном сжатии.

         Формат WMA подходит для кодирования самых разных записей. Низкие и средние частоты в его исполнении хороши, но начиная с 8КГц он начинает своевольничать с частотами и всячески искажать их..

4) MS ADPCM

         ADPCM - это адаптивное дифференциальное кодирование звуковых отсчетов. Строго говоря, этот формат нельзя назвать сжатием - так как сжатие предполагает необратимое удаление части информации о звуке. В то время как ADPCM представляет собой всего лишь другую, более экономичную, форму записи той же самой информации. Вместо абсолютного значения величины отсчета записывается некое число, равное изменению текущего отсчета по отношению к предыдущему. А так как скорость изменения звукового давления довольно небольшая, можно под запись этого числа выделить меньше разрядов, и получить соответствующую экономию.

         Так и сделано в форматах MS и IMA ADPCM. Для записи разностей используется 4 разряда, вместо 16. Это дает нам экономию в 4 раза.

        ADPCM всегда обеспечивает высочайшее качество звучания. Что и неудивительно - ведь это не "сжатие". Кодеки формата ADPCM имеют простое устройство, благодаря чему они работают в реальном времени даже на младших моделях 486 и старших 386. Этот формат - исторически первый, получивший широкое применение для записи музыки в компьютерном мире. Существуют реализации ADPCM даже под DOS . Когда еще никто ничего не слышал про MP3, формат ADPCM был единственной реальной возможностью высококачественного сжатия.

          С ростом мощности компьютеров формат ADPCM сдал позиции формату MP3, который сжимает сильнее (в 10 раз) и шире поддерживается потребительским программным обеспечением. Но память он оставил после себя хорошую, как основа целой эпохи в развитии цифрового звука. 5) IMA ADPCM

        Это версия ADPCM, разработанная в Interactive Multimedia Association (IMA). Несмотря на то, что принципы работы обеих реализаций ADPCM одинаковы, эти две реализации несовместимы между собой. Версия IMA работает быстрее версии MS, преимущество в скорости достигает 5 раз. IMA ADPCM - самый быстрый кодек из представленных в этом обзоре. Хотя возможности современных процессоров делают эту характеристику несущественной. Сегодня можно себе позволить писать прямо в MP3. Но если ставится задача специального характера - например, нужно записывать звук одновременно по сотне каналов, да еще параллельно с обычной работой, да еще на маломощной машине, - вот тут формату IMA ADPCM цены не будет. Исключительно быстрая штука. Качество звука на некоторых частотах - в пользу одной версии, на других - в пользу другой.

6) CCITT A-Law/u-Law G.711

        Этот формат уменьшает разрядность с 16-ти до 8 бит, сохраняя данные в нелинейной, логарифмической форме. То есть, просто говоря, слабые звуки записываются с большой разрешающей способностью, а сильные звуки - наоборот, с маленькой разрешающей способностью. Такой поход отлично согласуется с характеристикой чувствительности человеческого слуха, которая является тоже логарифмической. Степень сжатия - в 2 раза. Линейное PCM кодирование невозможно использовать при разрядности 8 бит даже для записи голоса. Характерные цифровые искажения чрезвычайно сильны - так как слабые составляющие звука превращаются в очень неприятный для слуха скрежет.

7) Конвертер MS-PCM

         Конвертер MS-PCM преобразует частоту дискретизации потоков PCM, количество каналов (моно - стерео), разрядность (поддерживается только 8 или 16 бит). Если требуется изменить более одной характеристики, программа, использующая этот кодек, должна организовать многошаговое преобразование (Multistep Format Conversion). Не рекомендуется применять передискретизацию без крайней необходимости - заметно деградирует качество звука. При преобразовании вверх система должна вставлять в поток РСМ отсчеты, полученные примитивной интерполяцией. Хуже при преобразовании вниз - система должна отфильтровать частоты, не укладывающиеся в диапазон, определенной теоремой Котельникова (Найквиста), и только после этого выкидывать отсчеты. Реализован ли алгоритм фильтрации в кодеке Microsoft, не известно. Но, зная, с кем мы имеем дело, логично предположить, что нет. А ведь это серьезный недостаток. Нарушая теорему Котельникова, мы имеем все шансы получить неустранимое искажение, наложение спектров.  Вряд ли такой звук кому покажется нормальным. Но совсем плохо, когда исходная и конечная частота не кратны друг другу. Чтобы выполнить такое преобразование, придется преобразовывать сигнал в определенную промежуточную частоту, фильтровать и потом делать конечную частоту. После этой варварской "высшей математики", очевидно, о качестве звука можно прочно забыть.

8) VQF

Этот относительно молодой формат, разработанный компанией NTT несколько лет назад. Алгоритм кодирования широко не разглашается. В любом случае, сравнивая результаты кодирования в форматах VQF и MP3, можно заметить, что алгоритмы имеют очень мало общего и основаны на совершенно разных подходах к сжатию звука. Это проявляется, прежде всего, в том, что VQF-файлы звучат гораздо более естественно, чем MP3 и точно передают записи с широким динамическим диапазоном - то есть живую музыку. Так же в записях VQF значительно меньше искажений на средних и низких частотах. Зато на "верхах" он проигрывает MP3 - выше 15КГц наблюдается сильный завал частот, который особенно ощущается при кодировании шумов. Все это предполагает весьма своеобразную методику сжатия аудио.

Итак, в чем же заключаются преимущества VQF перед другими форматами? Самая сильная сторона формата - степень сжатия. VQF-файл с компрессией 80Кб/с по качеству идентичен MP3-файлу, записанному в 128Кб/c. То есть степень сжатия превосходит МР3 более чем на 30%. Минута звучания достойного качества в VQF занимает немногим больше 600Кб. Это действительно значительное преимущество.

Главный недостаток алгоритма - очень большое потребление системных ресурсов. При проигрывании VQF на каком-нибудь P166 на выполнение остальных задач процессор будет просто неспособен. Скорость кодирования файлов просто очень маленькая, 3-4 минуты звучания на P200MMX при полной остановке других приложений могут кодироваться минут двадцать. Некоторые кодировщики, впрочем, способны кодировать файлы за время значительно меньшее, чем время звучания самого кодируемого файла, но в их системных требованиях рекомендуется процессором типа Pentium 4.

Еще один серьезный недостаток VQF, который, впрочем, также касается владельцев не слишком "продвинутого" оборудования - на многих дешевых звуковых платах файлы VQF звучат просто ужасающе. Не вполне ясно, с чем связан подобный эффект, но факт остается фактом: если у вас десятидолларовая "пищалка", то и звук из VQF вы, скорее всего, получите соответствующий. Разработчики формата рекомендуют использовать Hi-Fi платы, красующиеся на полках магазинов с ценниками в $150 и выше. Впрочем, недорогие карты семейства SB Live!, а также другие достойно сделанные экземпляры все-таки воспроизводят VQF с приемлемым качеством. Похоже, что преобразователи на качественных звуковых платах, в отличие от дешевых поделок, способны сгладить некую "зернистость", получаемую при раскодировании VQF-потоков.

       VQF очень хорош для акустических записей. Малые искажения, чуть "подрезанные" верхи и широта динамического диапазона делают его незаменимым форматом для записи живых инструментов и всевозможных гитар.

9) OGG Vorbis

          Этот формат был опубликован летом 2000 года. В это же время появилась бета-версия его кодера.

         Ogg - контейнер представляет собой виртуальный ящик, позволяющий хранить в себе различные данные. В случае с Ogg - это аудиопоток и текстовые данные: наименование песен, альбома, исполнителя и другие комментарии. В других случаях в контейнере может хранится несколько видео- и аудио-потоков с разными характеристиками, а также субтитры, меню, данные о главах, статичные изображения и так далее. Контейнер MP3 в этом смысле несколько ограничен, туда невозможно добавить дополнительные поля. Контейнер Ogg поддерживает ограниченное количество предопределённых полей (Title, Artist, Album, Track, Date, Genre, Comment), и неограниченное число полей Other с собственными заголовками и содержимым.

          Соответственно, Vorbis - это название алгоритма сжатия звука. То есть, это CODEC (кодер/декодер), который в зависимости от настроек пользователя и своих алгоритмов решает, как именно нужно сжимать звуковые данные. Адаптивный цельнопреобразовательный алгоритм кодека Vorbis основан на том же принципе, что и MP3, а именно на MDCT (Modified Discrete Cosine Transform, модифицированное дискретное косинусное преобразование), но на этом сходство форматов заканчивается. Vorbis, в отличие от, например, MP3, поддерживает разрядность до 24 бит, частоту дискретизации до 192kHz и до 255 звуковых каналов (включая 5.1), таким образом опережая MPEG-2, WMA и Musepack.

         Теперь перейдём к преимуществам Ogg Vorbis, которые можно понять и проанализировать:

  • Формат Ogg Vorbis изначально оптимизирован для потокового вещания: степень сжатия может меняется автоматически в зависимости от условий передачи, пакеты не имеют предопределённого размера (минимального, максимального или ожидаемого), они (пакеты) могут быть обрезаны или повреждены - ничто из этого не вызовет сбоя воспроизведения, к тому же в контейнер встроен механизм коррекции ошибок;
  • Благодаря тому, что Vorbis - "урождённый" VBR (variable bitrate) формат, он не привязан к "ступеням" битрейта (96, 112, 128, 160, 192...), а кодирует каждый кадр (frame) с тем битрейтом, который больше всего соответствует текущим условиям (это может быть и 113, и 178, и 234);
  • В алгоритм кодека встроена функция "bitrate peeling" - возможность уменьшения битрейта без перекодирования;
  • Данные, сжатые по алгоритму Vorbis, в среднем занимают меньше места по сравнению с данными, сжатыми по алгоритму MP3. Или, при одинаковом размере, будут звучать лучше;
  • Ogg Vorbis идеально подходит в качестве стандарта передачи аудиоданных в глобальной сети, то есть является реальной заменой MP3 и WMA, а также подходит для хранения записей с качеством, близким к CD. Это доказывают многочисленные "слепые" тесты (когда участники теста не знают, каким алгоритмом зажат тот или иной файл - все они предварительно декодируются и предоставляются в формате WAV), проведённые независимыми исследователями.
  • Эти исследования показывают, что на низких битрейтах (96 и менее) у Vorbis нет конкурентов, на средних он звучит идентично с WMA, а на высоких битрейтах (от 170 и выше) Vorbis опережают только AAC, Real Audio 8 и - иногда - Musepack. В то же время, качество MP3 на всех битрейтах отмечено как наихудшее.
  • Ogg Vorbis всё чаще используется разработчиками программного обеспечения в своих продуктах (преимущественно в играх: LockOn, Heroes of Might and Magic IV, Unreal Tournament 2003, Vietnam, Код доступа: Рай, Crimsonland).
  • кодек нашёл применение в качестве стандарта для китайского EVD - Enhanced Versatile Disc, замене DVD.

Теперь рассмотрим слабые стороны, их немного:

  • важнейшим препятствием на пути Ogg Vorbis (как, в принципе, и любого другого формата) стоит консерватизм пользователей.
  • немалую роль играет сопротивление софтверных компаний (как гигантов, так и средних компаний): несмотря на наличие всех исходных кодов и отсутствие лицензионных отчислений, разработчики или упорно игнорируют наличие альтернативных форматов, или вставляют им палки в колёса. Microsoft же, как всегда, агрессивно рекламирует своё детище - WMA, при этом, выставляя худшие стороны в лучшем свете: поддержка DRM, по мнению Microsoft, является величайшим благом для пользователя. Кстати, Windows кроме "родных" форматов WMA, MP3 и WAV наотрез отказывается воспроизводить прочие аудиофайлы.
  • свою лепту вносят и производители мультимедийной техники, которые только к концу 2003 года начали потихоньку "раскачиваться" и встраивать поддержку Ogg Vorbis в плееры, диктофоны и блочные проигрыватели DVD. Иногда, правда, это делается за счёт других форматов (как поступила iRiver - пользователь может выбирать между WMA и Ogg, но вместе они быть не могут). Непонятно, почему это не делалось раньше.

·         Еще один из недостатков формата OGG Vorbis - это относительная медленность упаковки и недоработанность кодеков. Впрочем, с оптимизацией программ для упаковки OGG и эти недостатки исчезнут.

  2.6  Кодеки для сжатия только речи

        Сжатие голосовых данных неразрывно связано с вокодерными методами. Вокодер - это некий прибор (теперь он для нас является черным ящиком) или алгоритм, который осуществляет анализ и формализацию структуры голосовой информации. Затем формализованные данные можно обрабатывать обычными математическими методами - сжимать их, преобразовывать, зашифровывать, редактировать и так далее.

         Вокодерные методы позволяют добиться очень высокой степени сжатия (до 100 раз), но качество звука при этом получается более чем посредственное. В коммерческих кодеках редко применяется сжатие более чем в 30 раз из соображений сохранения минимального благозвучия фонограммы. Например, кодек Voxware MetaVoice позволяет разместить 1 минуту звучания в файле размером 25 Кb, что соответствует сжатию в 37 раз. Необходимо подчеркнуть, что оцифровку голоса рекомендуется проводить только при частоте 8 KHz, разрядности 16 bit, и в монофоническом режиме. Это стандарт, многие кодеки просто не поддерживают другие параметры. Характеристики наиболее широко распространенных кодеков сведены в таблицу 2. Степень сжатия указана относительно исходного 1-минутного файла PCM 8 KHz/16 bit/mono, размер которого - 938 Kb.

Таблица 2

формат       |   степень сжатия, раз (приблизительно)   | 1 минута, Kb

MSN 13000 Baud                 10                             96

MSN  8000 Baud                 15                             61

MS GSM 6.10                    10                             96

DSP Group TrueSpeech           15                             63

L&H CELP 4,8                   25                             36

L&H SBS 12                     10                             87

ACELP.net 5                    25                             37

ACELP.net 8,5                  15                             62

          Сжатие голосовых сигналов широко применяется в IP-телефонии, которая без этого была бы невозможна. Недостаток всех перечисленных кодеков - они не обладают свойством изменения скорости потока данных в зависимости от передаваемого сигнала. А ведь разговорная речь, даже в случае монолога, содержит паузы, на время которых канал передачи можно закрывать, получая тем самым дополнительную экономию. Эффективная система передачи голоса обязательно должна обеспечивать подавление пауз. Режим переменного битрейта   является   родным в   формате   OGG   Vorbis,   который   обеспечивает степень сжатия большую, чем MP3.

1) GSM 6.10

        Этот кодек сжимает в 10 раз (приблизительно). Поддерживает только моно. Особенность кодека - у него есть панель настройки, на которой устанавливаются предельные частоты сжатия и воспроизведения. Качество звука среднее. Системные требования низкие - сжатие на 44 100 KHz в режиме реальном времени проходит уже на Pentium-100. 2) DSP Group TrueSpeech

          Сжимает в 15 раз, то есть одна минута занимает 63 Kb. Особенность - поддерживает только исключительно частоту 8 KHz, моно. Мало этого, так еще этот кодек требует обязательно установленного флага "Non Realtime". Хотя, при установленном этом флаге прекрасно работает и в реальном времени. Качество звука несколько хуже, чем у GSM, но достаточное. Системные требования относительно низкие - работает в режиме реального времени, начиная с Pentium-75 или AMD-5x86-133 MHz. Можно рекомендовать такой кодек для архивирования больших объемов телефонных или диспетчерских переговоров. 3) MSN - Microsoft Network Audio codec

         Название говорит само за себя. Степень сжатия - около 10 раз. Качество звука на 13 000 Baud - хорошее, а на 8 000 Baud - не очень. 4) Lermount & Haspie SBC/CELP

          Фирма Lermount & Haspie известна своими системами распознавания речи, которые одно время лидировали на рынке. Кодеки SBC/CELP входят в состав программы Net Meeting, которая предназначена для общения по локальной сети. Кодеки отличаются большой степенью сжатия, однако, качество звука невысокое. 5) ACELP.net

          Этот кодек о себе сообщает следующее: "ACELP.net audio encoder/decoder. For licensing please access http://www.sipro.com". Изготовлен он фирмой Sipro Lab Telecom Inc, Montreal. Видимо, разработка более современная, так как он сочетает значительную степень сжатия (до 25 раз) с хорошим качеством звука. Отсутствует хрипение, характерное для L&H CELP. Системные требования высокие. Поддерживает только моно, и только частоты 8000 и 16000 KHz. В целом производит хорошее впечатление.    2.7  Рекомендации по выбору форматов

          Широкой публике не известен факт, что микрофонный вход во всех стандартных звуковых картах является монофоническим. Поэтому мы наблюдаем такие нелепые вещи, как, например, совет в уважаемом журнале "Компьютер-пресс"  записать голосовое поздравление с микрофона в формате MP3 56kBit/s 24 kHz, Stereo. Вот Stereo здесь совсем ни к чему, и частота неоправданно высокая - для голоса вполне хватает 8000 Hz. Выбирать частоту выше - просто бессмысленно. Выбрав более подходящий формат, мы вместо файла размером 207 Kb (30 секунд звука) получаем файл размером всего 30 Kb - экономия в 7 раз.

          При записи голоса оправдано выбирать частоты: 8000 Hz, - если источник - телефон или связная аппаратура; 12000 - если это радиопрограмма на длинных, средних, коротких волнах (в общем, с амплитудной модуляцией). При радиовещании на FM/УКВ с частотной модуляцией, согласно международным стандартам, диапазон передаваемого звука - от 20 до 15000 Hz. Таким образом, очевидно, что для записи такого сигнала оправдано выбрать частоту 32000 Hz. Впрочем, на практике хорошо идет и частота 22050 Hz. Более высокие частоты - просто бесполезный расход дискового пространства.

3          

            Общее описание программного обеспечения реализующего разработанный алгоритм

         Основной идеей дипломного проекта, является реализация алгоритма обслуживающего предоставленные технические средства и удовлетворяющего параметрам поставленной задачи. Поэтому автором было принято решение не разрабатывать целиком всё программное обеспечение, а использовать имеющиеся в наличии компоненты, которые не решают поставленной задачи без построения автором соответствующего алгоритма. Эти инструменты были автором соответственным образом изучены и частично использованы при реализации алгоритма.

         Исходя из ниже перечисленных достоинств автор остановился на таком языке программирования как Delphi:

1) Для кого предназначен Delphi

         В первую очередь Delphi предназначен для профессионалов-разработчиков корпоративных информационных систем. Однако Delphi предназначен не только для программистов-профессионалов. Любой программист на Pascal способен практически сразу профессионально освоить Delphi. Специалисту, ранее использовавшему другие программные продукты, придется труднее, однако самое первое работающее приложение он сможет написать в течение первого же часа работы на Delphi. И, конечно же, открытая технология Delphi является мощным гарантом того, что инвестиции, сделанные в Delphi, будут сохранены в течение многих лет.

2) Высокопроизводительный компилятор в машинный код

           В отличие от большинства Паскаль-компиляторов, транслирующих в p-код, в Delphi программный текст компилируется непосредственно в машинный код, в результате чего Delphi- приложения исполняются в 10-20 раз быстрее (особенно приложения, использующие математические функции). Готовое приложение может быть изготовлено либо в виде исполняемого модуля, либо в виде динамической библиотеки, которую можно использовать в приложениях, написанных на других языках программирования.

3) Открытая компонентная архитектура

           Благодаря такой архитектуре приложения, изготовленные при помощи Delphi, работают надежно и устойчиво. Delphi поддерживает использование уже существующих объектов, включая DLL, написанные на С и С++, OLE сервера, VBX, объекты, созданные при помощи Delphi. Из готовых компонент работающие приложения собираются очень быстро.

4) Библиотека визуальных компонент

          Эта библиотека объектов включает в себя стандартные объекты построения пользовательского интерфейса, объекты управления данными, графические объекты, объекты мультимедиа, диалоги и объекты управления файлами, управление DDE и OLE.

5) Компоненты доступа к базам данных и визуализации данных

Библиотека объектов содержит набор визуальных компонент, значительно упрощающих разработку приложений для СУБД с архитектурой клиент-сервер.  Объекты инкапсулируют в себя нижний уровень - Borland Database Engine.

Предусмотрены специальные наборы компонент, отвечающих за доступ к данным, и компонент, отображающих данные. Компоненты доступа к данным позволяют осуществлять соединения с БД, производить выборку, копирование данных, и т.п.

Компоненты визуализации данных позволяют отображать данные виде таблиц, полей, списков. Отображаемые данные могут быть текстового, графического или произвольного формата.

                       Рис 3        Delphi: настраиваемая cреда разработчика

          Ha cтpaницe Standard палитры компонентов сосредоточены стандартные для Windows интерфейсные элементы, без которых не обходится практически ни одна программа (рис 4).

                                                     Рис 4

       B страницу Additonal помещены 18 дополнительных компонентов, с помощью которых можно разнообразить вид диалоговых окон (рис 5).

                                                      Рис 5

        Страница Win32 содержит интерфейсные элементы для 32-paзpядныx

операционных систем Windows 95/98/NT/2000 (рис 6).

                                                       Рис 6

         Cтpaницa BDE (рис.7) - здесь представлены компоненты, поддерживающие доступ к данным с помощью BDE - Table, Query, StoredProc и т. п. Mexaнизм BDE в равной степени успешно работает как с фaйл-cepвepными, так и с клиeнт-cepвepными БД. Кoмпoнeнты этой страницы есть во всех версиях Delphi.

                                                       Рис 7

Cтpaницa Data Controls. 15 кoмпoнeнтoв этoй cтpaницы пpeднaзнaчeны для визyaлизaции дaнныx, иx ввoдa и peдaктиpoвaния (рис.8).

                                                      Рис 8

             Программный интерфейс телефонии (TAPI)

          Microsoft Win32 прикладной программный интерфейс телефонии (TAPI) обеспечивает услуги, которые дают возможность прикладному разработчику добавить телефонную связь к приложениям, разработанным для операционных систем, которые поддерживают Microsoft ® Win32 ® API

         Чтобы обеспечивать лучшую работу (выполнение) и поддержку на платформе Windows NT и на будущих выпусках платформы Windows 95, Win32 API телефонии и его поставщики услуг и компоненты поддержки полностью осуществлены как 32-разрядные компоненты в Win32. В дополнение к полному 32-разрядному выполнению, Win32 TAPI включает эти много новых особенностей:

ᄋ родная 32-разрядная поддержка. Все ядро TAPI компоненты - Win32, с полной поддержкой процессоров не Intel (выполняющийся Windows NT), симметрические многопроцессорные, многопоточные приложения, и приоритетная многозадачность.

ᄋ 32-разрядная прикладная мобильность. Существование Win32 полного TAPI и помогает приложениям TAPI, которые в настоящее время работают на Windows 95 (использующие TAPI 1.4 API) выполненный на Windows NT на Intel x86 семейство микропроцессоров без модификации или перетрансляции.

ᄋ 16-разрядная прикладная мобильность. Существование Win16 полного TAPI и помогает  приложениям TAPI, которые в настоящее время работают на Windows 95 и операционной системе Windows - 3.1 (использующие TAPI 1.3 API) выполненный на Windows NT без модификации или перетрансляции.

ᄋ поддержка уникода. Win32 приложения может выбрать существующий ANSI-код функциями TAPI или вызывать версии юникода функций, которые передают или возвращают строки (функции с суффиксом "W").

ᄋ сервисные процессы. TAPI 2.0 добавляет механизмы для того, чтобы уведомить приложения событием телефонии, притом не требуется чтобы приложение имело окно, таким образом давая возможность фоновым сервисным процессам легко использовать TAPI услуги.

ᄋ NDISTAPI совместимость. Существующая поддержка в Windows NT 3.5 для минипортов глобальной сети цифровой сети комплексного обслуживания под Службой удаленного доступа сохраняется. NDIS драйверы минипорта глобальной сети поддерживаются при поставщике услуг привилегированного режима без модификации.

ᄋ поддержка системного реестра. Все параметры телефонии сохранены в системном реестре. Поставщики услуг телефонии и все сохраненные параметры могут быть модифицированы во время работы локальной сети.

ᄋ поддержка Центра Запроса. TAPI поддерживает функциональные возможности, требуемые в среде центра запроса, включая моделирование прогнозирующих портов набора номера и очередей, управления агента устройства автоматического распределения вызовов, управления состояния набора станции, и централизованной синхронизации случая.

ᄋ качество Обслуживания (QOS) Приложения могут запросить, договориться, и повторно договориться о качестве обслуживания, и получить индикацию относительно QOS на прибывающих запросах и когда QOS изменен сетью.

ᄋ расширенное совместное использование устройства. Приложения могут ограничить обработку прибывающих запросов на устройстве к отдельному адресу, поддерживать особенности типа звонящего и при использовании указать ожидаемый режим носителей прибывающих запросов. Приложения, делающие экспортные запросы могут установить конфигурацию устройства при создании запроса.

ᄋ компоненты непривилегированного режима. Полная TAPI система, включая поставщика услуг верхнего уровня DLLs, выполняется в непривилегированном режиме.

        Телефония - технология, которая интегрирует компьютеры с телефонной сетью. С телефонией, люди могут использовать их компьютеры, чтобы использовать в своих интересах широкий диапазон сложных особенностей связи и услуг по телефонной линии.

       Прикладной программный интерфейс телефонии (TAPI) позволяет программистам разрабатывать приложения, которые обеспечивают личную телефонию пользователям. TAPI поддерживает и речь и передачу данных, учитывает разнообразие конечных устройств, и поддерживает сложные типы подключения и методы управления запроса типа запросов конференции, режима отложенного звонка, и речевой почты.

1)  Использование телефонии в приложениях

          Возможности телефонии помогают людям получать большую выгоду от системы передачи данных, разрешая ей более эффективно управлять их запросами голоса и управлять их операциями передачи данных. Вы можете использовать TAPI, чтобы продемонстрировать эту эффективность любому менеджеру базы данных приложения, электронной таблице, приложению обработки текстов, посылая и получая данные через телефонную сеть.

        TAPI дает вам непротиворечивый набор инструментальных средств для того, чтобы включить эти особенности в ваши приложения:

ᄋ соединяются непосредственно с телефонной сетью, а не полагаются на отдельное приложение связи

ᄋ номера телефона набираются автоматически

ᄋ передаются документы как файлы, факсы, или электронная почта

ᄋ данные доступа от поиска новостей и других информационных служб

ᄋ установка и управление запросами конференции

ᄋ получение, сохранение, и сортировка речевой почты

ᄋ идентификация вызывающей программы использования, чтобы автоматизировать обработку входящих запросов

ᄋ управление операциями удаленного компьютера

ᄋ совместная работа, используя телефонные линии

 

        TAPI обеспечивает ваше приложение доступом к телефонной сети. Вы обеспечиваете ваших пользователей доступом к этим особенностям. Это означает, что вы выбираете и создаете интерфейс пользователя, который является совместимым с остальной частью вашего приложения. Вы выбираете интерфейс, и позволяете TAPI выполнять работу управления телефонными подключениями (связями).

2)  Сетевые услуги

        TAPI обеспечивает доступ к разнообразным телефонным сетевым услугам. Хотя эти услуги могут использовать различные технологии, чтобы установить запросы и передать голос и данные, TAPI делает их сервисно-определенными и  прозрачными для приложений. Это означает, что Вы можете создать приложения, которые могут использовать в своих интересах любую доступную службу без включения сервисного определенного кода в вашем приложении.

       Использование TAPI для обычной телефонной сети является прямым, потому что обычная телефонная сеть сравнительно проста. Обычно используется только один тип информации (типа данных или голоса) в запросе.

3)  Компоненты Телефонии

        Базируемая на Windows Открытая Архитектура Услуг (WOSA) модель, Windows Телефония состоит из TAPI и TAPI32 библиотек динамической связи (которые заставляют приложение, посылать запрос Службе Телефонии на обработку), TAPISRV.EXE (который осуществляет и управляет функциями TAPI) и одним или более поставщиками услуг телефонии (драйверы). TAPI обеспечивает не зависящий от устройства интерфейс для того, чтобы выполнить задачи телефонии. Поставщики услуг - библиотеки динамической связи, которые выполняют и возможно зависящие от устройств действия нижнего уровня.

       Когда приложение вызывает функцию TAPI, TAPI динамически компонуемая библиотека проверяет правильность и генеральные параметры функции и передает управление TAPISRV.EXE. TAPISRV (Служба Телефонии) обрабатывает запрос и направляет запрос соответствующему поставщику услуг. Чтобы получать запросы от TAPISRV, поставщик услуг должен осуществить интерфейс драйвера службы Телефонии (TSPI). Поставщик услуг может обеспечить различные уровни интерфейса драйвера службы: основной, дополнительный, или расширенный (продленный). Например, простой поставщик услуг мог бы обеспечить основное обслуживание (службу) телефонии, типа поддержки запросам выхода, через Hayes-совместимый модем. Заказной поставщик услуг, написанный сторонним продавцом, мог бы обеспечить полный диапазон приходящей и уходящей поддержки запроса.

        Приложения используют функции TAPI, чтобы определить, какие услуги являются доступными на данном компьютере. TAPI определяет, какие поставщики услуг являются доступными, и обеспечивает информацию об их возможностях к приложениям. Этим способом, любое приложение может запросить услуги от того же самого поставщика услуг; TAPI управляет всем доступом к поставщику услуг.

        Для разработки алгоритма будем использовать компоненты TAPI 2.2 для Delphi7 (рис 9):

                                                                Рис 9

         Опишем те компоненты, которые будем использовать в дипломном проекте, а также рассмотрим используемые события, свойства и методы их обработки.

Компоненты TAPILineService и TAPIPhoneService инкапсулируют различные функции соответствующей службы TAPI. Задачей этих сервисов  является загружать TAPI.DLL и согласовывать соглашения версий.

Руководящие устройства (TAPILineDevice, TAPIPhoneDevice) - это абстракция аппаратных средств типа модема / ISDN карты или телефона.

Линии – TAPILine. Каждому руководящему устройству  могут быть подчинены различные линии.

Объект TTapiCallParams помогает вам формировать необходимую структуру TAPI.

Адрес – TAPIAddress. Минимум один адрес подчинен каждой линии. TAPI отличает 2 различных адресных формата: выборный и AddressID.

Вызовы – TAPICall.  Вызов представляет подключение (связь) по меньшей мере, двух адресов.

Таблица 3

Свойства компонент

Пояснение

TTapiLine.Active

Это свойство активирует и дезактивирует прибор строки телефонии

TTapiLine.MediaModes

Это - набор разрядных флажков, которые указывают режимы носителей, которые используются, когда прибор строки TAPI активизирован, устанавливая TTapiLine

TTapiLine.Privileges

Это свойство используется, чтобы управлять привилегией, которую TTapiLine элемент хочет иметь к входящему, и исходящему запросу

TTapiLine.Device

Указывается компонент типа TAPILineDevice

TTapiCallParams.BearerMode

Этот свойство указывает режим, который используется, когда создан запрос.

TTapiCallParams.AddressID

Это свойство указывает адрес, который используется, когда создан запрос

TTapiCallParams. CallParamsFlags

Это - набор разрядных флажков, который использует LINECALLPARAMFLAGS_ константы

TTapiCallParams.MediaMode

Этот свойство указывает MediaMode, который используется, когда создан запрос

TAPILineDevice. LineMapper

Разрешает TAPI определить нужное устройство самостоятельно.

TAPILineDevice.ID

TAPIPhoneDevice.ID

Идентификатор устройства подключенного к линии.

TAPILineService.AppName

TAPIPhoneService.AppName

Это название приложение, которое посылало или первоначально принимало запрос или ответило на запрос.

TAPICall.Info.CallerID

Это свойство содержит информацию, которая идентифицирует возникающий адрес запроса.

TAPIPhone.SpeakerHookSwitchMode

Устанавливает режим работы общей связи

TAPIPhone.SpeakerVolume

Объем звуковых данных общей связи

TAPIPhone.SpeakerGain

Коэффициент усиления общей связи

TAPIPhone.HeadSetHookSwitchMode

Устанавливает режим работы наушников

TAPIPhone.HandSetHookSwitchMode

Устанавливает режим работы микрофона

TAPIPhone.HeadSetVolume

Объем звуковых данных наушников

TAPIPhone.HeadSetGain

Коэффициент усиления наушников

TAPIPhone.HandSetVolume

Объем звуковых данных микрофона

TAPIPhone.HandSetGain

Коэффициент усиления микрофона

Таблица 4

Методы объектов

Пояснение

TAPIAddress1.OutboundCall.MakeCall

Функция размещает запрос на строке

TAPICall1.Drop

TAPIAddress1.OutboundCall.Drop;

Метод понижает или разъединяет точно установленный запрос. Запрос типично перемещается в неактивный запрос, и будет через некоторое время освобожден

TAPIAddress1.InboundCall.Answer

Метод отвечает на точно установленный запрос предложения. После того, как запросу успешно ответили, состояние запросов типично переходит на связанное состояние

TAPICall1.DeallocateCall

В TAPI больше ненужный (неактивный) запрос должен быть удален, чтобы освободить внутренние ресурсы.

TAPIAddress1.InboundCall.Accept

Функция принимает точно установленный предлагаемый запрос. И показывает что приложение примет контроль вызова.

Таблица 5

События

Пояснения

TAPILineDevice. OnStateReMoved

При удалении устройства из системы

TAPILineDevice. OnStateRinging

Событие вызывается тогда, когда “ИН” (Индикатор звонка) обнаружил активный сигнал в порту

TAPICall. OnInfoCallerId

CallerID информация появилась или изменилась

TAPICall. OnReply

При ответе устройства на запрос

TAPICall. OnStateBusy

При состоянии в линии – ‘занято’

TAPICall. OnStateConnected

При состоянии соединения

TAPICall. OnStateDisconnected

При состоянии разъединения

TAPICall. OnStateIdle

События появляется если запрос находится в неактивном состоянии

TAPICall. OnStateOffering

Входящий запрос обнаружен на строке

TAPICall. OnStateProceeding

Появляется когда идет набор номера, и запрос продолжает проходить сквозь коммутатор или телефонную сеть.

            Обработка звуковых файлов в Windows

        Наряду с базовой подсистемой файлового ввода/вывода, представленной функциями CreateFile, ReadFile, WriteFile и т.п., в Windows существует подсистема мультимедийного (звукового, видео и им подобного) файлового ввода/вывода MMIO (Multimedia Input/Output). Подсистема была введена еще в Windows 3.x, и позволяет удобно и эффективно работать со звуковыми и видеофайлами, а также упрощает работу с файлами, размещенными в оперативной памяти (memory files).

1) Файлы типа RIFF

         Подсистема может оперировать с двоичными файлами любого типа, однако она содержит стандартные средства для работы с файлами типа RIFF (Resource Interchange File Format - формат файла обмена ресурсами). Фирмы Microsoft и IBM предложили этот формат в качестве универсального средства организации и хранения данных с иерархическо-последовательной структурой в системах Windows и OS/2.

         Структуру RIFF имеют файлы типа WAV (поток оцифрованного звука), IDF (описатель MIDI–инструмента), AVI (поток оцифрованного изображения и звука), ANI (описатель "оживленного" (анимированного) курсора мыши), RMI (один из видов MIDI–партитуры) и многие другие. Creative Labs использует формат RIFF в файлах типа CSP (программы для специализированного звукового процессора ASP звуковых адаптеров Sound Blaster) и SBK/SF2 (загружаемых банков инструментов для звуковых адаптеров классов Sound Blaster AWE и Live!). Универсальный формат загружаемых банков инструментов DLS (DownLoadable Sounds), принятый в качестве стандарта ассоциацией производителей MIDI–систем (MMA - MIDI Manufacturers Association), построен на основе RIFF. Фирма Aureal применяет этот формат для построения загружаемых банков инструментов для своих звуковых чипов.

2) Разделы RIFF–файлов

         Файлы типа RIFF состоят из разделов (chunk - кусок). Раздел содержит набор данных определенного типа. Большая часть разделов непосредственно представляет наборы данных, однако некоторые разделы содержат внутри себя подразделы (subchunks), которые представляют собственно поток данных, его параметры, формат и т.п. Охватывающий раздел в этом случае называется главным, или родительским (parent chunk).

3) Код FOURCC

       Для обозначения типов разделов, а также в некоторых других целях, используется специальный код. Тип FOURCC (Four-Character Code - четырехсимвольный код) представляет собой двойное слово (DWORD), содержащее слово из 1..4 ASCII–символов - "RIFF", "wave", "fmt" и т.п. Слова короче четырех символов дополняются справа пробелами.

       Порядок символов в двоичном представлении типа FOURCC тот же, что и в файле: первый символ представляется младшим байтом, а последний - старшим. Поэтому простое присваивание символьной константы (например, 'fmt ') даст обратное расположение байтов в двойном слове. Для корректного формирования значения можно использовать макросы MAKEFOURCC и mmioFOURCC.

        Для кодов главных разделов определены константы FOURCC_RIFF и FOURCC_LIST.

4) Ключи мультимедийных файлов

         Как и в случае обычных файлов Windows, для доступа к мультимедийному файлу используется его ключ - числовое значение, возвращаемое функцией mmioOpen. Фактически, ключ файла представляет собой указатель системного описателя файла, расположенного в памяти подсистемы MMIO.

       Ключи обычных и мультимедийных файлов несовместимы между собой, однако уже открытый обычный файл можно повторно открыть в подсистеме MMIO, передав его ключ (типа HANDLE) функции mmioOpen.

5) Информационная структура файла

        Для каждого открытого файла подсистема MMIO поддерживает информационную структуру, описывающую режимы работы с файлом и его параметры. Базовая информационная структура находится внутри самой подсистемы MMIO, приложение может поддерживать собственную локальную копию типа MMIOINFO в своей собственной области памяти.

6) Буферизация файлового обмена

        Обмен информацией с файлом может быть непосредственным или буферизованным.

       Непосредственный обмен подразумевает прямое чтение информации с диска и запись ее обратно на диск, и эффективен в том случае, когда обмен с файлом идет большими (несколько килобайт или больше) блоками данных, размеры которых кратны размеру сектора диска (обычно 512 байтов), и сами блоки начинаются также на границе сектора. При обмене мелкими (несколько десятков или сотен байтов), или некратными сектору блоками резко возрастают накладные расходы.

       При буферизованном обмене между приложением и файлом находится так называемый буфер файла. При чтении из файла вначале неявно считывается полный буфер, а последующие функции чтения выбирают нужные порции данных из буфера, не обращаясь при этом к диску. При записи все работает наоборот: функции записи вначале заполняют буфер, а затем полностью записанный буфер неявно переносится в файл одной операцией записи.

      Строго говоря, в MMIO даже непосредственный обмен с файлом включает простую скрытую буферизацию в самой подсистеме, так как минимальной единицей обмена данными с диском является сектор.

7) Процедуры обмена данными

        Файловые функции MMIO на самом деле являются промежуточными. Весь фактический обмен с файлом выполняют так называемые процедуры обмена (I/O Procedures). Стандартные процедуры обмена обслуживают файлы на дисковых устройствах и в оперативной памяти; пользовательские процедуры могут обслуживать файлы на любом носителе, или даже полностью виртуальные файлы, не имеющие физического представления.

8) Структура звуковых файлов RIFF/WAVE

       Файлы типа RIFF/WAVE служат для хранения оцифрованных звуковых потоков в различных звуковых форматах - PCM, ADPCM, a-Law, GSM, Audio MPEG и т.п. Стандартное расширение для файлов этого типа - WAV.

       Минимальный состав WAVE–формы включает два подраздела: формата и данных. Раздел формата имеет код "fmt", и содержит описатель формата звуковых данных в виде расширенной структуры WAVEFORMATEX. Раздел данных состоит либо из одного подраздела "data", содержащего единый поток звуковых данных в цифровом виде, либо из подраздела-списка "wavl", содержащего последовательность из подразделов "data" и "slnt" (silent - тихий). Каждый подраздел "data" задает отдельный фрагмент звучания, подраздел "slnt" - фрагмент тишины (паузу) заданной длительности.

       Для форматов, отличных от PCM, и в случае использования списка "wavl" после раздела "fmt" вставляется дополнительный раздел "fact". Первое двойное слово (DWORD) области данных раздела "fact" содержит общее количество звуковых отсчетов (samples) в файле. При помощи этого параметра можно определить время воспроизведения файла, поделив количество отсчетов на значение поля nSamplesPerSec в описателе формата, или вычислить объем, который поток займет после восстановления в PCM - умножив количество отсчетов на значение поля nBlockAlign в описателе выбранного для восстановления формата PCM.

        В настоящее время область данных раздела "fact" включает только описанное поле, однако в будущем она может быть расширена добавлением дополнительных полей. Это необходимо иметь в виду, ориентируясь на размер области данных раздела, указанный в его заголовке. По размеру области данных можно узнать о наличии в разделе полей расширения.

        В качестве необязательных элементов звукового файла перед разделом данных могут присутствовать разделы "cue" (список "флажков", или "закладок" внутри звукового потока - cue points), "plst" (порядок воспроизведения фрагментов - playlist), "adtl" (раздел типа "LIST", разная дополнительная информация о файле - associated data list) и т. п.

9)  Структуры, используемые в MMIO

    MMCKINFO - описатель раздела файла

        Описывает раздел файла типа RIFF. Первые три поля структуры представляют собой заголовок раздела в том же виде, в котором он присутствует в файле; поле fccType присутствует только в заголовках главных разделов.

  FOURCC  ckid;

  DWORD  cksize;

  FOURCC  fccType;

  DWORD  dwDataOffset;

  DWORD  dwFlags;

§  ckid - код (идентификатор) раздела.

§  cksize - размер области данных раздела в байтах. Поле отражает точный размер области данных; в него не входит размер заголовка и возможный дополнительный байт, автоматически дописываемый к области данных нечетного размера.

§  fccType - тип главного раздела, если в поле ckid указан код "RIFF" и "LIST".

§  dwDataOffset - смещение области данных раздела относительно начала файла. Значение этого поля удобно использовать в функции mmioSeek для позиционирования на начало области данных.

§  dwFlags - флаги состояния раздела.

MMIOINFO - информационная структура файла

Описывает состояние открытого файла, его буфера и процедуры обмена данными.

  DWORD  dwFlags;

  FOURCC  fccIOProc;

  LPMMIOPROC  pIOProc;

  UINT  wErrorRet;

  HTASK  hTask;

  LONG  cchBuffer;

  HPSTR  pchBuffer;

  HPSTR  pchNext;

  HPSTR  pchEndRead;

  HPSTR  pchEndWrite;

  LONG  lBufOffset;

  LONG  lDiskOffset;

  DWORD  adwInfo [4];

  DWORD  dwReserved1;

  DWORD  dwReserved2;

  HMMIO  hmmio;

§  dwFlags - режимы открытия/опроса и флаги состояния файла, копируемые из параметра Mode функции mmioOpen.

§  fccIOProc - код установленной процедуры обмена. Если функция не является установленной - поле имеет нулевое значение. Для файлов универсальной структуры стандартная функция обмена имеет код "DOS".

§  pIOProc – указатель процедуры обмена. Если приложение не использует процедуру обмена, в этом поле находится указатель стандартной процедуры обмена файловой подсистемы.

§  wErrorRet – код ошибки, возвращаемый при неудачном завершении функции mmioOpen.

§  hTask – ключ задачи (task), созданной для процедуры обмена.

§  cchBuffer - размер буфера файла. Для файлов без буфера поле имеет нулевое значение.

§  pchBuffer - указатель буфера файла. Для файлов без буфера поле имеет нулевое значение.

§  pchNext - указатель текущей позиции в буфере.

§  pchEndRead - ограничитель чтения в буфере.

§  pchEndWrite - ограничитель записи в буфере.

§  lBufOffset - зарезервированное поле для служебного использования.

§  lDiskOffset - текущее смещение внутри файла. Поле управляется процедурами обмена.

§  adwInfo - дополнительная информация, используемая процедурами обмена. Используется также для передачи дополнительных данных при открытии файла.

§  dwReserved1, dwReserved2 - зарезервированные поля.

§  hmmio - ключ открытого файла.

10) Функции MMIO

    Классы функций

     Средства мультимедийной файловой подсистемы включают три основных класса функций:

  • базовые - открытие, закрытие, чтение и запись файлов. Этот класс практически аналогичен стандартным средствам работы с файлами языка C.
  • управления буферизацией - создание или установка промежуточного буфера и манипуляции с ним, а также - с текущей позицией буфера.
  • работы с форматом RIFF - операции с файлами универсального формата RIFF.

       Все функции интерфейса имеют имена с префиксом mmio. В заголовке описания каждой функции этот префикс опущен; полное имя каждой функции приведено в ее прототипе.

Перечень базовых функций :

Таблица 6

mmioStringToFOURCC

Преобразование строки ASCIZ в код FOURCC

mmioOpen

Открытие или опрос файла

mmioClose

Закрытие файла

mmioRename

Переименование файла

mmioRead

Чтение из файла

mmioWrite

Запись в файл

mmioSeek

Позиционирование по файлу

Перечень функций управления буферизацией:

Таблица 7

mmioGetInfo

Запрос информационной структуры файла

mmioSetInfo

Модификация информационной структуры файла

mmioSetBuffer

Установка буфера для файла

mmioAdvance

Продвижение по файлу

mmioFlush

Принудительная запись буфера в файл

Перечень функций работы с форматом RIFF:

Таблица 8

mmioCreateChunk

Создание раздела

mmioAscend

Выход из раздела

mmioDescend

Вход в раздел

Перечень остальных функций интерфейса:

Таблица 9

mmioSendMessage

Посылка произвольного сообщения процедуре обмена

mmioInstallIOProc

Установка процедуры обмена

IOProc

Прототип процедуры обмена

Возвращаемые значения

Для функций, возвращающих значения типа MMRESULT, а также для ряда других, определены константы кодов завершения с префиксами MMSYSERR_ и MMIOERR_.

Таблица 10

FILENOTFOUND

Файл не найден

OUTOFMEMORY

Недостаточно памяти

CANNOTOPEN

Невозможно открыть файл

CANNOTCLOSE

Невозможно закрыть файл

CANNOTREAD

Невозможно прочитать из файла

CANNOTWRITE

Невозможно записать в файл

CANNOTSEEK

Невозможно позиционировать файл

CANNOTEXPAND

Невозможно расширить файл

CHUNKNOTFOUND

Раздел не найден

UNBUFFERED

Файл открыт для непосредственного доступа

PATHNOTFOUND

Недопустимый путь (устройство и/или каталог)

ACCESSDENIED

Доступ к файлу запрещен

SHARINGVIOLATION

Нарушение условий совместного доступа

NETWORKERROR

Ошибка сетевой подсистемы

TOOMANYOPENFILES

Нет свободных описателей ключей для нового файла

INVALIDFILE

Общая ошибка, неудача по неизвестной причине

            Подсистема сжатия звука в Windows

1) Драйверы, преобразователи, кодеки, фильтры

В ACM существует два вида обработки звука:

  • Преобразование формата - изменение способа представления звуковых данных, перекодировка их из одного представления в другое без изменения общих свойств самого звука.
  • Фильтрование - обработка звука в потоке (усиление/ослабление, изменение АЧХ, наложение звуковых эффектов и т.п.) без изменения формата.

       Модули драйверов ACM, реализующие функции преобразования форматов, называют преобразователями формата (format convertors). Модули, реализующие функции фильтрования, называются фильтрами (filters). Один и тот же подключаемый драйвер может совмещать в себе различные функции, а также - содержать более одного преобразователя или фильтра.

          Преобразование форматов, при котором меняется тип (tag) формата, обычно сопровождается изменением объема звуковых данных. Такие виды преобразования называются сжатием (compression) или восстановлением (decompression). Сжатию обычно подвергаются данные в формате PCM, а при восстановлении формат PCM обычно имеет результат операции. Преобразователи формата, реализующие сжатие/восстановление, называются кодеками (codec - coder/decoder или compressor/decompressor).

2) Аппаратная поддержка драйверов

       Большинство драйверов ACM являются программными - они используют для своей работы только ресурсы центрального процессора, и не нуждаются в каких-либо дополнительных аппаратных средствах. Для успешной работы программного драйвера необходим лишь достаточно мощный центральный процессор и необходимое количество основной памяти.

        При наличии в системе DSP (Digital Signal Processor - цифровой сигнальный процессор), который может обрабатывать звук практически без участия центрального процессора, для него может быть разработан драйвер ACM, выполняющий обработку звука средствами этого DSP. Сам DSP при этом может быть, как встроен в системную плату, так и находиться на одной из плат расширения. В этом случае говорят, что драйвер ACM имеет аппаратную поддержку.

       Некоторые звуковые устройства поддерживают аппаратное преобразование форматов в реальном времени при вводе/выводе звука - например, они могут выдавать записываемый звук сразу в формате ADPCM, сжимая его "на ходу" при помощи встроенного DSP. Несмотря на то, что такие устройства бесполезны для полнофункционального драйвера ACM и полностью поддерживаются базовой звуковой подсистемой MME/Wave, ACM предоставляет некоторые удобства в отношении и таких устройств. ACM содержит средства поиска и выбора форматов по различным критериям, и одним из таких критериев является аппаратная поддержка формата одним из звуковых адаптеров - при вводе и/или при выводе.

         Поскольку формально подсистемы MME/Wave и ACM никак не связаны между собой, для определения аппаратно поддерживаемых форматов такой звуковой адаптер должен быть снабжен упрощенным драйвером ACM, который и будет выделять поддерживаемые адаптером форматы из общего списка, а также - возвращать приложению идентификатор звукового устройства, к которому следует обратиться. А если звуковой адаптер поддерживает обработку звука независимо от его записи/воспроизведения - драйвер ACM может быть и полнофункциональным. В последнем случае ресурсы аппаратуры разделяются между подсистемами MME/Wave и ACM.

3) Синхронные и асинхронные драйверы

         Как и драйверы звуковых адаптеров, драйверы ACM также могут быть синхронными и асинхронными. Практически все программные драйверы являются синхронными; драйверы с аппаратной поддержкой обычно делаются асинхронными. Для асинхронных драйверов предусмотрена очередь входных заданий и механизм уведомления приложения о завершении ранее запрошенных операций; синхронные драйверы не возвращают приложению управления до тех пор, пока не будет завершена запрошенная операция.

4) Уведомление приложений о выполнении операций

        Для уведомления об изменении приоритетов и состояний драйверов заданному окну приложения посылается заданное сообщение Windows. Окно и сообщение задаются подобно установке нового драйвера - функцией acmDriverAdd. Окно, получающее такие сообщения, называется окном уведомления (notification window).

5) Типы фильтров и форматов

       Основной характеристикой фильтра или формата является его тип - способ обработки данных в фильтре (эхо, усиление/ослабление) или способ представления данных в формате (PCM, ADPCM, MPEG и т.п.).

       Конкретные форматы и фильтры внутри каждого типа отличаются только параметрами: частотой дискретизации, разрядностью отсчета, тонкостями кодирования - для форматов, степенью усиления/ослабления сигнала, величиной задержки - для фильтров. Основные характеристики - способ представления и вид обработки - в пределах одного типа остаются неизменными.

        Каждому типу фильтров и форматов присвоен свой уникальный код (tag), который однозначно идентифицирует его в подсистеме сжатия. Коды типов имеют неизменные числовые значения и для обеспечения уникальности должны быть зарегистрированы в Microsoft. Наряду с кодами типов ACM использует также индексы (внутренние номера) типов фильтров/форматов, поддерживаемых каждым из драйверов. Индексы не имеют ничего общего с кодами и отражают лишь порядковые номера фильтров/форматов различного типа в служебных списках драйвера. При помощи индексов удобно последовательно перебирать все типы фильтров/форматов, поддерживаемые заданным драйвером.

6) Порции и буферы преобразуемых данных

       Преобразование данных в ACM производится порциями. Порция потока преобразования обычно имеет размер от нескольких десятков байт до нескольких сотен килобайт, в зависимости от структуры звукового формата и динамики преобразования. За каждую операцию преобразования обрабатывается одна порция данных.

      Для каждого потока преобразования создаются два буфера: входной - для порции исходных данных, и выходной - для порции данных результата. Размер преобразуемой порции не может превышать выбранного размера буфера.

7) Потоки преобразования

        Как и основная звуковая подсистема MME/Wave, ACM обрабатывает звуковые данные потоками. Это означает, что приложение не может обрабатывать звуковые данные в произвольной последовательности, а только последовательно, от начала к концу потока. Такое ограничение связано с тем, что как преобразование форматов, так и фильтрование может потребовать информации о предшествовании - например, относительное кодирование амплитуд в формате ADPCM или формирование эффекта эха в фильтре Echo. Поэтому обработка звукового потока в ACM включает в себя три стадии:

  • Создание, или открывание потока (acmStreamOpen). При этом приложение сообщает ACM параметры потока - форматы, режимы обработки, способы уведомления - и получает от ACM ключ открытого потока.
  • Обработка потока (acmStreamConvert). На этом этапе приложение последовательно передает ACM буферы обмена, содержащие порции преобразуемых звуковых данных. ACM передает буферы выбранному драйверу для обработки, а после завершения обработки каждый буфер возвращается приложению. Обработка потока может происходить в реальном времени, если аппаратура компьютера успевает выполнять ее достаточно быстро.
  • Уничтожение, или закрывание потока (acmStreamClose). Последняя операция с потоком, после которой поток перестает существовать.

         Поток преобразования ACM фактически состоит из двух звуковых потоков - исходного (source) и результирующего (destination). Данные исходного потока существуют до начала обработки и не изменяются после ее завершения; данные результирующего потока создаются в процессе обработки.

8) Ключи объектов

         Как и в остальных подсистемах Windows, объекты ACM, с которыми работает приложение, идентифицируются специальными ключами, которые ACM возвращает приложению в ответ на запрос доступа к объекту. В ACM имеется три вида объектов:

  • идентификатор драйвера (driver id). Используется для указания установленного драйвера в ACM, например - при запросе параметров драйвера. Каких-либо специальных операций перед использованием идентификатора не требуется.
  • выбранный для работы драйвер (driver). Возвращается ACM при открывании драйвера, и используется для ссылок к подмножеству открытых для работы драйверов.
  • поток (stream). Возвращается ACM при открывании потока и используется для операций с потоком.

Каждый из объектов имеет свой тип ключа - HACMDRIVERID, HACMDRIVER, HACMSTREAM. Кроме этого, имеется универсальный тип HACMOBJ, предназначенный для использования в функциях, работающих с объектами различного типа.

9) Типы и структуры, используемые в ACM

        Большинство структур имеет в своем составе поле cbStruct, в которое приложение должно занести размер области памяти, где размещена структура. Интерфейсные функции используют это поле двояким образом: когда информация из структуры является исходной - поле показывает, какой ее объем реально присутствует в указанной области памяти; когда функция заполняет поля структуры возвращаемой информацией - поле cbStruct ограничивает размер заполняемой области. В зависимости от выбранной функции и режимов ее работы существуют различные ограничения на размер области памяти: она может включать либо только часть полей описанной структуры, либо всю структуру целиком, либо иметь резервную область непосредственно за концом структуры. В последнем случае резервная область может использоваться для дополнительных данных, не вошедших в основные поля описанной структуры.

        Когда ACM заполняет структуру, содержащую поле cbStruct, в него заносится реальный размер возвращенной информации. Если какие-то поля структуры являются необязательными, приложение может определить, какая часть структуры была заполнена ACM.

При обращении к ACM вместе со структурой часто передается сопровождающий набор флагов, показывающих, какие из полей структуры несут осмысленную информацию. Несмотря на то, что такие поля анализируются лишь при наличии соответствующих флагов, многие функции являются "привередливыми" и требуют, чтобы неиспользуемые входные поля имели нулевые значения. Чтобы гарантировать успешную работу функций, необходимо перед обращением к ним либо обнулить все неиспользуемые входные поля, либо обнулить всю структуру до заполнения ее полей осмысленной информацией.

Структура WAVEFORMATEX

 WORD    wFormatTag ;

WORD    nChannels ;

 DWORD   nSamplesPerSec ;

 DWORD   nAvgBytesPerSec ;  

 WORD    nBlockAlign ;  

 WORD    wBitsPerSample ;  

 WORD    cbSize ;  

·        wFormatTag - формат Waveform audio.

·        nChannels - количество каналов. Обычно 1 (моно) или 2(стерео);

·        nSamplesPerSec - частота дискретизации. Для формата PCM - в классическом смысле, т.е. количество выборок в секунду. Согласно теореме отсчетов должна вдвое превышать частоту оцифровываемого сигнала. Обычно находится в диапазоне от 8000 до 44100 выборок в секунду;

·        nAvgBytesPerSec - средняя скорость передачи данных. Для PCM равна nSamplesPerSec*nBlockAlign;

·        nBlockAlign - размер блока данных, для PCM равен (nChannels*wBitsPerSample)/8;

·        wBitsPerSample - количество бит в одной выборке. Для PCM равно 8 или 16;

·        cbSize – подсчет размера  в байтах

Структура WAVEFILTER

Полностью описывает параметры фильтра.

DWORD  cbStruct;

DWORD  dwFilterTag;

DWORD  fdwFilter;

DWORD  dwReserved [5];

§  cbStruct - размер области памяти, занимаемой структурой.

§  dwFilterTag - код типа фильтра.

§  fdwFilter - флаги параметров и режимов работы фильтра. На данный момент пока не определено флагов для этого поля.

§  dwReserved - служебные поля ACM и драйвера.

Структура ACMDRIVERDETAILS

Описывает параметры и свойства драйвера ACM. Кроме cbStruct, поля структуры заполняются ACM.

DWORD  cbStruct;

FOURCC  fccType;

FOURCC  fccComp;

WORD  wMid;

WORD  wPid;

DWORD  vdwACM;

DWORD  vdwDriver;

DWORD  fdwSupport;

DWORD  cFormatTags;

DWORD  cFilterTags;

HICON  hicon;

char  szShortName [ACMDRIVERDETAILS_SHORTNAME_CHARS];

char  szLongName [ACMDRIVERDETAILS_LONGNAME_CHARS];

char  szCopyright [ACMDRIVERDETAILS_COPYRIGHT_CHARS];

char  szLicensing [ACMDRIVERDETAILS_LICENSING_CHARS];

char  szFeatures [ACMDRIVERDETAILS_FEATURES_CHARS];

§  cbStruct - размер области памяти, занимаемой структурой.

§  fccType - тип драйвера в формате FOURCC. Для драйверов ACM это поле имеет значение ACMDRIVERDETAILS_FCCTYPE_AUDIOCODEC (строка "audc").

§  fccComp - подтип драйвера в формате FOURCC. Это поле обычно имеет значение ACMDRIVERDETAILS_FCCCOMP_UNDEFINED (нуль).

§  wMid, wPid - идентификаторы производителя (Manufacturer) и продукта (Product). Константы, представляющие коды известных производителей и продуктов, определены в файле MMREG.H.

§  vdwACM, vdwDriver - версии службы ACM, для которой создан драйвер, и самого драйвера.

§  fdwSupport - флаги поддерживаемых драйвером возможностей и режимов. cFormatTags - количество различных типов форматов (способов представления данных), поддерживаемых драйвером.

§  cFilterTags - количество различных типов фильтров (способов обработки звука), поддерживаемых драйвером.

§  hicon - ключ иконки (пиктограммы) драйвера, либо NULL при отсутствии пиктограммы.

§  szShortName - короткое (сокращенное) название драйвера.

§  szLongName - длинное (полное) название драйвера.

§  szCopyright - строка информации об авторских правах.

§  szLicensing - строка информации об условиях использования драйвера.

§  szFeatures - строка информации о возможностях драйвера.

Структуры ACMFILTERTAGDETAILS / ACMFORMATTAGDETAILS

Описывают параметры типа фильтров/форматов, и различаются только именами полей. Поля структур заполняются ACM, если не оговорено иначе.

Структура ACMFILTERTAGDETAILS:

DWORD  cbStruct; 

DWORD  dwFilterTagIndex; 

DWORD  dwFilterTag; 

DWORD  cbFilterSize; 

DWORD  fdwSupport; 

DWORD  cStandardFilters; 

char  szFilterTag [ACMFILTERTAGDETAILS_FILTERTAG_CHARS]; 

Структура ACMFFORMATTAGDETAILS:

DWORD  cbStruct;

DWORD  dwFormatTagIndex;

DWORD  dwFormatTag;

DWORD  cbFormatSize;

DWORD  fdwSupport;

DWORD  cStandardFormats;

char  szFormatTag [ACMFORMATTAGDETAILS_FORMATTAG_CHARS];

§  cbStruct - размер области памяти, занимаемой структурой.

§  dwFilterTagIndex / dwFormatTagIndex - индекс (внутренний номер) данного типа внутри драйвера. Кроме случаев запроса описания по индексу поле должно быть нулевым; ACM всегда возвращает в этом поле нулевое значение.

§  dwFilterTag / dwFormatTag - уникальный код типа. Устанавливается приложением для тех случаев, когда запрос делается по коду типа. После успешного выполнения запроса всегда устанавливается ACM.

§  cbFilterSize / cbFormatSize - размер области памяти, достаточный для размещения расширенной структуры WAVEFILTER / WAVEFORMATEX, описывающей любой из фильтров/форматов данного типа.

§  fdwSupport - флаги поддерживаемых возможностей и режимов драйвера этого типа фильтров/форматов.

§  cStandardFilters / cStandardFormats - количество стандартных фильтров/форматов данного типа, поддерживаемых драйвером.

§  szFilterTag / szFormatTag - текстовое название типа.

Структуры ACMFILTERDETAILS / ACMFORMATDETAILS

Описывают параметры конкретного фильтра/формата, и различаются только именами полей:

Структура ACMFILTERDETAILS:

DWORD  cbStruct; 

DWORD  dwFilterIndex; 

DWORD  dwFilterTag; 

DWORD  fdwSupport; 

LPWAVEFILTER  pwfltr; 

DWORD  cbwfltr; 

char  szFilter [ACMFILTERDETAILS_FILTER_CHARS]; 

Структура ACMFORMATDETAILS:

DWORD  cbStruct;

DWORD  dwFormatIndex;

DWORD  dwFormatTag;

DWORD  fdwSupport;

LPWAVEFORMATEX  pwfx;

DWORD  cbwfx;

char  szFormat [ACMFORMATDETAILS_FORMAT_CHARS];

§  cbStruct - размер области памяти, занимаемой структурой.

§  dwFilterIndex / dwFormatIndex - индекс (внутренний номер) стандартного фильтра/формата внутри драйвера. В отличие от индексов типов, индексы стандартных фильтров/форматов однозначно определяют конкретные стандартные фильтры и форматы в пределах хотя бы одной версии драйвера. Кроме случаев запроса описания по индексу поле должно быть нулевым; ACM всегда возвращает в этом поле нулевое значение.

§  dwFilterTag / dwFormatTag - код типа, которому принадлежит фильтр/формат. Устанавливается приложением для тех случаев, когда запрос делается по коду типа. После успешного выполнения запроса всегда устанавливается ACM.

§  fdwSupport - флаги поддерживаемых возможностей и режимов драйвера этого типа форматов.

§  pwfltr / pwfx - указатель структуры WAVEFILTER / WAVEFORMATEX, которую при запросе описания фильтра/формата ACM заполняет его параметрами.

§  cbwfltr / cbwfx - размер области памяти, в которой размещена структура WAVEFILTER / WAVEFORMATEX.

§  szFilter / szFormat - текстовое название стандартного фильтра/формата внутри его типа. Вместе с полем szFilterTag / szFormatTag структуры ACMFILTERTAGDETAILS / ACMFORMATTAGDETAILS образует уникальное текстовое название фильтра/формата внутри всей подсистемы ACM.

Структуры ACMFILTERCHOOSE и ACMFORMATCHOOSE

Эти две очень похожие структуры описывают наборы данных, необходимые для вывода пользователю диалога, содержащего меню всех доступных или подходящих стандартных фильтров/форматов. Используются функциями acmFilterChoose и acmFormatChoose.

Структура ACMFILTERCHOOSE:

DWORD  cbStruct;

DWORD  fdwStyle;

HWND  hwndOwner;

LPWAVEFILTER  pwfltr;

DWORD  cbwfltr;

LPCSTR  pszTitle;

char  szFilterTag [ACMFILTERTAGDETAILS_FILTERTAG_CHARS];

char  szFilter [ACMFILTERDETAILS_FILTER_CHARS];

LPSTR  pszName;

DWORD  cchName;

DWORD  fdwEnum;

LPWAVEFILTER  pwfltrEnum;

HINSTANCE  hInstance;

LPCSTR  pszTemplateName;

LPARAM  lCustData;

ACMFILTERCHOOSEHOOKPROC  pfnHook;

Структура ACMFORMATCHOOSE:

DWORD  cbStruct;

DWORD  fdwStyle;

HWND  hwndOwner;

LPWAVEFORMATEX  pwfx;

DWORD  cbwfx;

LPCSTR  pszTitle;

char  szFormatTag [ACMFORMATTAGDETAILS_FORMATTAG_CHARS];

char  szFormat [ACMFORMATDETAILS_FORMAT_CHARS];

LPSTR  pszName;

DWORD  cchName;

DWORD  fdwEnum;

LPWAVEFORMATEX  pwfxEnum;

HINSTANCE  hInstance;

LPCSTR  pszTemplateName;

LPARAM  lCustData;

ACMFORMATCHOOSEHOOKPROC  pfnHook;

§  cbStruct - размер области памяти, занимаемой структурой.

§  fdwStyle - флаги стилей построения диалога. Имена констант флагов выбора фильтра имеют префикс ACMFILTERCHOOSE_STYLEF_, имена констант флагов выбора формата - ACMFORMATCHOOSE_STYLEF_:

Таблица 11

CONTEXTHELP

В диалоге будет доступна контекстно-зависимая помощь. При запросе пользователем помощи ACM будет посылать окну-владельцу сообщения с кодами ACMHELPMSGCONTEXTMENU и ACMHELPMSGCONTEXTHELP, параметры wParam и lParam которых будут скопированы из исходных сообщений WM_CONTEXTMENU или WM_CONTEXTHELP. Коды сообщений ACM предварительно должны быть зарегистрированы в Windows посредством функции RegisterWindowMessage.

ENABLEHOOK

Разрешает использование функции перехвата сообщений Windows, заданной полем pfnHook.

ENABLETEMPLATE

Диалог будет создан из шаблона (template), описываемого полями hInstance и pszTemplateName.

ENABLETEMPLATEHANDLE

Поле hInstance содержит ключ уже загруженного в память шаблона диалога. В этом случае поле pszTemplateName игнорируется.

INITTOFILTERSTRUCTINITTOWFXSTRUCT

Начальные значения для типа и стандартного фильтра/формата в диалоге будут выбраны на основе описателя, указатель которого задан полем pwfltr / pwfx. В этом случае поле pwfltr/pwfx должно ссылаться на правильно заполненную структуру типа WAVEFILTER / WAVEFORMATEX.

SHOWHELP

Диалог будет снабжен кнопкой запроса помощи (Help), при нажатии которой окну-владельцу будет посылаться сообщение ACM с кодом ACMHELPMSGSTRING. Это сообщение необходимо предварительно зарегистрировать в Windows посредством функции RegisterWindowMessage.

§  hwndOwner - ключ окна-владельца (owner window) создаваемого диалога. Может быть нулевым, если окно-владелец не требуется.

§  pwfltr / pwfx - указатель области памяти для структуры типа WAVEFILTER / WAVEFORMATEX, в которую заносится описание выбранного фильтра/формата при успешном завершении выбора. Из этой же структуры берутся начальные значения полей диалога, если присутствует соответствующий флаг стиля.

§  cbwfltr / cbwfx - размер области памяти для структуры описания фильтра/формата. Если указанного размера недостаточно для записи требуемой структуры - ACM возвращает код ошибки NOTPOSSIBLE, одновременно занося в это поле требуемый размер области.

§  pszTitle - указатель строки заголовка диалога. Если это поле имеет нулевое значение - ACM использует заголовок по умолчанию.

§  szFilterTag / szFormatTag - область для строки названия типа фильтров/форматов. При успешном завершении выбора ACM заносит в это поле название выбранного типа.

§  szFilter / szFormat - область для строки названия стандартного фильтра/формата. При успешном завершении выбора ACM заносит в это поле название выбранного стандартного фильтра или формата.

§  pszName - указатель строки названия пресета для фильтра/формата. Если поля pszName и cchName описывают корректную символьную строку, и флагами стилей не задана установка начальных значений, ACM пытается найти соответствующий пресет и установить по нему начальные значения списков диалога. Поиск пресетов происходит путем посимвольного сравнения строк с игнорированием регистра. После успешного завершения выбора, если поля pszName и cchName описывают буфер достаточного размера, ACM заносит в него название выбранного пресета. Если выбранный фильтр/формат не имеет пресета (Untitled) - в буфер заносится пустая строка.

§  cchName - размер буфера, указываемого полем pszName, в байтах. Если pszName равно нулю, значение этого поля игнорируется.

§  fdwEnum - флаги режимов перебора фильтров/форматов. Вместе с полем pwfltrEnum / pwfxEnum задают условия, которым должны удовлетворять фильтры/форматы, включаемые в списки выводимого диалога. Поскольку для построения списков ACM пользуется собственными же функциями перебора, в этом поле используются те же флаги, что и в функциях acmFilterEnum / acmFormatEnum. Если поле pwfltrEnum / pwfxEnum имеет нулевое значение, поле флагов перебора тоже должно быть нулевым.

§  pwfltrEnum / pwfxEnum - указатель описателя фильтра/формата - структуры типа WAVEFILTER / WAVEFORMATEX, отдельные поля которой, либо вся структура целиком, задают условия для отбора фильтров/форматов, включаемых в списки выводимого диалога.

§  hInstance - ключ области данных, содержащей шаблон для создания диалога. Имя ресурса задается полем pszTemplateName. Поле используется только при наличии в стиле диалога флагов ENABLETEMPLATE или ENABLETEMPLATEHANDLE; в противном случае значение поля должно быть нулевым.

§  pszTemplateName - имя ресурса, содержащего шаблон для создания диалога. Для нумерованных ресурсов может использоваться стандартный макрос Windows MAKEINTRESOURCE. Поле используется только при наличии среди в стиле диалога флага ENABLETEMPLATE; в противном случае значение поля должно быть нулевым.

§  lCustData - произвольное значение, определяемое приложением, которое будет передаваться в функцию перехвата сообщений - в параметре lParam сообщения WM_INITDIALOG.

§  pfnHook - указатель функции перехвата, которая будет получать сообщения Windows, адресованные диалогу выбора.

Структура ACMSTREAMHEADER

Описывает фрагмент преобразуемого звукового потока и называется заголовком потока.

DWORD  cbStruct; 

DWORD  fdwStatus; 

DWORD  dwUser; 

LPBYTE  pbSrc; 

DWORD  cbSrcLength; 

DWORD  cbSrcLengthUsed; 

DWORD  dwSrcUser; 

LPBYTE  pbDst; 

DWORD  cbDstLength; 

DWORD  cbDstLengthUsed; 

DWORD  dwDstUser; 

DWORD  dwReservedDriver [10]; 

§  cbStruct - размер области памяти, занимаемой структурой.

§  fdwStatus - флаги состояния буфера. Устанавливаются приложением в нуль, далее управляются ACM. Имена констант имеют префикс ACMSTREAMHEADER_STATUSF_:

Таблица 12

DONE

Преобразование завершено.

INQUEUE

Заголовок находится в очереди драйвера.

PREPARED

Заголовок подготовлен для передачи драйверу.

§  dwUser - вспомогательное информационное значение, общее для обоих потоков, передаваемое обратно в приложение при уведомлении. Устанавливается приложением.

§  pbSrc - указатель буфера, содержащего порцию данных исходного звукового потока. Устанавливается приложением.

§  cbSrcLength - размер порции данных в буфере исходного потока (в байтах). Устанавливается приложением.

§  cbSrcLengthUsed - количество байтов порции данных исходного потока, использованных в последней операции преобразования. Устанавливается драйвером.

§  dwSrcUser - вспомогательное информационное значение для исходного потока, передаваемое обратно в приложение при уведомлении. Устанавливается приложением.

§  pbDst - указатель буфера для порции данных результирующего звукового потока. Устанавливается приложением.

§  cbDstLength - размер буфера выходного потока (в байтах). Устанавливается приложением.

§  cbDstLengthUsed - размер порции данных, записанных в буфер результирующего потока последней операцией преобразования. Устанавливается драйвером.

§  dwDstUser - вспомогательное информационное значение для результирующего потока, передаваемое обратно в приложение при уведомлении. Устанавливается приложением.

§  dwReservedDriver - служебные поля для ACM и драйвера.

10)  Функции ACM

Классы функций интерфейса ACM

ACM имеет в своем составе четыре основных класса интерфейсных функций. Принадлежность функции к определенному классу обозначается префиксом в ее имени:

  • Функции работы с драйверами (acmDriver). Служат для установки, удаления, настройки, опроса и перебора доступных драйверов ACM.
  • Функции работы с фильтрами (acmFilter). Служат для опроса, перебора и выбора доступных фильтров.
  • Функции работы с форматами (acmFormat). Служат для опроса, перебора и выбора доступных форматов (кодеков).
  • Функции работы с потоками (acmStream). Служат для создания потоков преобразования и обработки порций данных в них.

Кроме этого, ACM сам может вызывать (callback) три типа функций приложения:

  • Функции поддержки перебора - вызываются в процессе перебора (enumeration) драйверов, типов форматов/фильтров, или стандартных форматов/фильтров, и служат для формирования списка перебираемых объектов или остановки процесса перебора при нахождении нужного объекта.
  • Функции перехвата - вызываются при поступлении сообщений Windows в стандартные диалоги ACM, выводимые пользователю функциями выбора фильтра или формата, и служат для перехвата (hook) этих сообщений до обработки их средствами ACM. Позволяют изменить принятое по умолчанию поведение стандартных диалогов ACM.
  • Функции уведомления - вызываются после завершения запрошенной операции. Уведомление также может происходить в виде установки объекта события (event) либо посылки сообщения - задаче (thread) или окну.

Информационные функции

Таблица 13

acmGetVersion

Запрос версии ACM

acmMetrics

Запрос различных параметров ACM

Функции работы с драйверами

Таблица 14

acmDriverAdd

Установка собственного драйвера приложения или задание окна уведомления

acmDriverRemove

Удаление собственного драйвера приложения

acmDriverOpen

Открывание драйвера

acmDriverClose

Закрывание драйвера

acmDriverDetails

Запрос сведений о драйвере

acmDriverEnum

Перебор доступных драйверов

acmDriverID

Запрос идентификатора драйвера

acmDriverPriority

Установка приоритета драйвера

acmDriverMessage

Передача сообщения драйверу

Функции работы с фильтрами

Таблица 15

acmFilterTagDetails

Запрос сведений о типе фильтра

acmFilterDetails

Запрос сведений о фильтре

acmFilterTagEnum

Перебор доступных типов фильтров

acmFilterEnum

Перебор доступных стандартных фильтров

acmFilterChoose

Выбор фильтра при помощи стандартного диалога ACM

Функции работы с форматами

Таблица 16

acmFormatTagDetails

Запрос сведений о типе формата

acmFormatDetails

Запрос сведений о формате

acmFormatTagEnum

Перебор доступных типов форматов

acmFormatEnum

Перебор доступных стандартных форматов

acmFormatChoose

Выбор формата при помощи стандартного диалога ACM

acmFormatSuggest

Запрос наиболее подходящего для преобразования формата

Функции работы с потоками

Таблица 17

acmStreamOpen

Открывание потока преобразования

acmStreamClose

Закрывание потока

acmStreamSize

Запрос размеров буферов потока

acmStreamPrepareHeader

Подготовка буфера потока

acmStreamUnprepareHeader

Отмена подготовки буфера потока

acmStreamConvert

Преобразование очередной порции данных в потоке

acmStreamReset

Сброс (уничтожение) потока

acmStreamMessage

Передача сообщения драйверу потока

Функции, определяемые приложением

В отличие от стандартных функций интерфейса, все функции этой группы определяются приложением. Имена, приведенные в таблице, являются условными, реальные функции приложения могут иметь любые имена. Приложение передает эти функции ACM при помощи указателей, а ACM вызывает их в заранее оговоренных случаях.

Таблица 18

DriverProc

Основная функция драйвера

ChooseHook

Перехват сообщений диалога выбора фильтра/формата

DriverEnumCallback

Поддержка перебора драйверов

FilterTagEnumCallback

Поддержка перебора типов фильтров

FilterEnumCallback

Поддержка перебора стандартных фильтров

FormatTagEnumCallback

Поддержка перебора типов форматов

FormatEnumCallback

Поддержка перебора стандартных форматов

StreamCallback

Уведомление о завершении операции с потоком

Возвращаемые значения

Большинство функций ACM возвращает значения типа MMRESULT - универсальный код результата звуковой подсистемы Windows. В дополнение к стандартным кодам, константы для которых имеют префикс MMSYSERR_, для ACM определены константы с префиксами ACMERR_:

Таблица 19

NOTPOSSIBLE

Невозможно выполнить запрошенную операцию. Обычно эта ошибка возникает при невозможности использовать требуемое сочетание форматов, или когда объема заданного буфера недостаточно для записи всех затребованных данных.

BUSY

Запрошенный драйвер в настоящее время используется, попытка закрыть поток с незавершенной асинхронной операцией, и т.п.

UNPREPARED

Буфер преобразования не был подготовлен функцией acmStreamPrepareHeader.

CANCELED

Пользователь закрыл кнопкой Cancel диалог, выведенный функцией выбора фильтра/формата.

3.5   Работа с базами данных в DELPHI

          В нашем проекте используется база данных (Paradox), поэтому рассмотрим основы баз данных. Под базой данных понимается не­ко­то­рая уни­фи­ци­ро­ван­ная со­во­куп­ность дан­ных, со­вме­ст­но ис­поль­зуе­мая пер­со­на­лом/на­се­ле­ни­ем груп­пы, предприятия, ре­гио­на, стра­ны, ми­ра... Задача базы данных состоит в хранении всех представляющих интерес данных в одном или нескольких местах, причем таким способом, который заведомо исключает ненужную избыточность. В хорошо спроектированной базе данных избыточность данных исключается, и вероятность сохранения противоречивых данных минимизируется. Таким образом, создание баз данных преследует две основные цели: понизить избыточность данных и повысить их надежность.

         В этом  дипломном проекте используется одна из  реляционных баз данных так как: во-первых, реляционные базы получили наибольшее распространение в мире; во-вторых, они наиболее “продвинуты” в научном плане; а в-третьих, ядро баз данных Borland Database Engine, на основе которого работают все последние продукты компании Borland, предназначено именно для работы с реляционными базами данных.

Жизненный цикл любого программного продукта, в том числе и системы управления базой данных, состоит (по-крупному) из стадий проектирования, реализации и эксплуатации.

         Естественно, наиболее значительным фактором в жизненном цикле приложения, работающего с базой данных, является стадия проектирования. От того, насколько тщательно продумана структура базы, насколько четко определены связи между ее элементами, зависит производительность системы и ее информационная насыщенность, а значит - и время ее жизни.

Требования к базам данных

Итак, хорошо спроектированная база данных:

*                    Удовлетворяет всем требованиям пользователей к содержимому базы данных. Перед проектированием базы необходимо провести обширные исследования требований пользователей к функционированию базы данных.

*                    Гарантирует непротиворечивость и целостность данных. При проектировании таблиц нужно определить их атрибуты и некоторые правила, ограничивающие возможность ввода пользователем неверных значений. Для  верификации данных перед непосредственной записью их в таблицу база данных должна осуществлять вызов правил модели данных и тем самым гарантировать сохранение целостности информации.

*                    Обеспечивает естественное, легкое для восприятия структурирование информации. Качественное построение базы позволяет делать запросы к базе более “прозрачными” и легкими для понимания; следовательно, снижается вероятность внесения некорректных данных и улучшается качество сопровождения базы.

 Удовлетворяет требованиям пользователей к производительности базы данных. При больших объемах информации вопросы сохранения производительности начинают играть главную роль, сразу “высвечивая” все недочеты этапа проектирования.

Следующие пункты представляют основные шаги проектирования базы данных:

             Определить информационные потребности базы данных.

             Проанализировать объекты реального мира, которые необходимо смоделировать в базе данных. Сформировать из этих объектов сущности и характеристики этих сущностей (например, для сущности “деталь” характеристиками могут быть “название”, “цвет”, “вес” и т.п.) и сформировать их список.

             Поставить в соответствие сущностям и характеристикам - таблицы и столбцы (поля) в нотации, выбранной Вами СУБД (Paradox, dBase, FoxPro, Access, Clipper, InterBase, Sybase, Informix, Oracle и т.д.).

             Определить атрибуты, которые уникальным образом идентифицируют каждый объект.

             Выработать правила, которые будут устанавливать, и поддерживать целостность данных.

             Установить связи между объектами (таблицами и столбцами), провести нормализацию таблиц.

 Спланировать вопросы надежности данных и, при необходимости, сохранения секретности информации.

Основные концепции реляционных баз данных

Прежде чем подробно рассматривать каждый из этих шагов, остановимся на основных концепциях реляционных баз данных. В реляционной теории одним из главных является понятие отношения. Математически отношение определяется следующим образом. Пусть даны n множеств D1,D2,...,Dn. Тогда R есть отношение над этими множествами, если R есть множество упорядоченных наборов вида  <d1,d2,...,dn>, где d1 - элемент из D1, d2 - элемент из D2, ..., dn - элемент из Dn. При этом наборы вида <d1,d2,...,dn> называются кортежами, а множества D1,D2,...,Dn - доменами. Каждый кортеж состоит из элементов, выбираемых из своих доменов. Эти элементы называются атрибутами, а их значения - значениями атрибутов, рис.9-а представляет нам графическое изображение отношения с разных точек зрения.

Рис. 9-а

Легко заметить, что отношение является отражением некоторой сущности реального мира (в данном случае - сущности “деталь”) и с точки зрения обработки данных представляет собой таблицу. Кортеж представляет собой строку в таблице, или, что то же самое, запись. Атрибут же является столбцом таблицы, или - полем в записи. Домен же представляется неким обобщенным типом, который может быть источником для типов полей в записи. Таким образом, следующие тройки терминов являются эквивалентными:

*           отношение, таблица

*           кортеж, строка, запись

*           атрибут, столбец, поле.

Реляционная база данных представляет собой совокупность отношений, содержащих всю необходимую информацию и объединенных различными связями.

Атрибут (или набор атрибутов), который может быть использован для однозначной идентификации конкретного кортежа (строки, записи), называется первичным ключом. Первичный ключ не должен иметь дополнительных атрибутов. Это значит, что если из первичного ключа исключить произвольный атрибут, оставшихся атрибутов будет недостаточно для однозначной идентификации отдельных кортежей. Для ускорения доступа по первичному ключу во всех системах управления базами данных (СУБД) имеется механизм, называемый индексированием. Грубо говоря, индекс представляет собой инвертированный древовидный список, указывающий на истинное местоположение записи для каждого первичного ключа. Естественно, в разных СУБД индексы реализованы по-разному (в локальных СУБД - как правило, в виде отдельных файлов), однако, принципы их организации одинаковы.

Возможно индексирование отношения с использованием атрибутов, отличных от первичного ключа. Данный тип индекса называется вторичным индексом и применяется в целях уменьшения времени доступа при нахождении данных в отношении, а также для сортировки. Таким образом, если само отношение не упорядочено каким-либо образом и в нем могут присутствовать строки, оставшиеся после удаления некоторых кортежей, то индекс (для локальных СУБД - индексный файл), напротив, отсортирован.

Для поддержания ссылочной целостности данных во многих СУБД имеется механизм так называемых внешних ключей. Смысл этого механизма состоит в том, что некоему атрибуту (или группе атрибутов) одного отношения назначается ссылка на первичный ключ другого отношения; тем самым закрепляются связи подчиненности между этими отношениями. При этом отношение, на первичный ключ которого ссылается внешний ключ другого отношения, называется master-отношением, или главным отношением; а отношение, от которого исходит ссылка, называется detail-отношением, или подчиненным отношением. После назначения такой ссылки СУБД имеет возможность автоматически отслеживать вопросы “ненарушения“ связей между отношениями, а именно:

*                    если Вы попытаетесь вставить в подчиненную таблицу запись, для внешнего ключа которой не существует соответствия в главной таблице (например, там нет еще записи с таким первичным ключом), СУБД сгенерирует ошибку;

*                    если Вы попытаетесь удалить из главной таблицы запись, на первичный ключ которой имеется хотя бы одна ссылка из подчиненной таблицы, СУБД также сгенерирует ошибку.

*                    если Вы попытаетесь изменить первичный ключ записи главной таблицы, на которую имеется хотя бы одна ссылка из подчиненной таблицы, СУБД также сгенерирует ошибку.

Сущность BDE

Мощность и гибкость Delphi при работе с базами данных основана на низкоуровневом ядре - процессоре баз данных Borland Database Engine (BDE). Его интерфейс с прикладными программами называется Integrated Database Application Programming Interface (IDAPI). В принципе, сейчас не различают эти два названия (BDE и IDAPI) и считают их синонимами. BDE позволяет осуществлять доступ к данным как с использованием традиционного record-ориентированного (навигационного) подхода, так и с использованием set-ориентированного подхода, используемого в SQL-серверах баз данных.

Все инструментальные средства баз данных Borland - Paradox, dBase, Database Desktop - используют BDE. Все особенности, имеющиеся в Paradox или dBase, “наследуются” BDE, и поэтому этими же особенностями обладает и Delphi.

Алиасы

Таблицы сохраняются в базе данных. Некоторые СУБД сохраняют базу данных в виде нескольких отдельных файлов, представляющих собой таблицы (в основном, все локальные СУБД), в то время как другие состоят из одного файла, который содержит в себе все таблицы и индексы (InterBase). Например, таблицы dBase и Paradox всегда сохраняются в отдельных файлах на диске. Директорий, содержащий dBase .DBF файлы или Paradox .DB файлы, рассматривается как база данных. Другими словами, любой директорий, содержащий файлы в формате Paradox или dBase, рассматривается Delphi как единая база данных. Для переключения на другую базу данных нужно просто переключиться на другой директорий. Как уже было указано выше, InterBase сохраняет все таблицы в одном файле, имеющем расширение .GDB, поэтому этот файл и есть база данных InterBase.

         Удобно не просто указывать путь доступа к таблицам базы данных, а использовать для этого некий заменитель - псевдоним, называемый алиасом. Он сохраняется в отдельном конфигурационном файле в произвольном месте на диске и позволяет исключить из программы прямое указание пути доступа к базе данных. Такой подход дает возможность располагать данные в любом месте, не перекомпилируя при этом программу. Кроме пути доступа, в алиасе указываются тип базы данных, языковый драйвер и много другой управляющей информации. Поэтому использование алиасов позволяет легко переходить от локальных баз данных к SQL-серверным базам (естественно, при выполнении требований разделения приложения на клиентскую и серверную части).

              Система регистрации речи диспетчерских переговоров

Инициализация начальных параметров

Выбор интерфейса

Загрузка параметров пользователя и Установка режима ожидания

Загрузка параметров администратора

Изменение параметров системы

Просмотр базы данных

Сохранение параметров

Проигрывание выбранного файла

Работа с БД (отбор, удаление записей)

Режим поднятия трубки оператором (ручной режим)

Модем в режиме автоподнятия трубки (автоматизированный режим)

Набор номера оператором

Регистрируется состояние соединения, установка параметров и начинается запись разговора

Регистрируется  состояние разъединения  и проверка параметров записи

Регистрация в базе данных разговора и сохранение звуковых данных на диске

Отмена регистрации вызова

1

Выход из программы

1

1

Рис 10

 

На рисунке 10 представлена приблизительная схема работы программы. Разберем ее более подробно.

        При запуске программы происходит размещение формата и заголовков wav, буфера данных, и получение имени временного файла. Режим рекордера устанавливаем 'нет режима записи'. Дальше проверяем наличие конфигурационного файла ‘config.ini’. Если он отсутствует то, значит, осуществляется первый запуск программы, а значит, требуется ее настройка. Программа автоматически предлагает выбор интерфейса с правами администратора (рис 11).

                       Рис 11                                                 Рис 12

В другом случае присутствует возможность выбора (рис 12). При нажатии кнопки ‘Вход ’ происходит инициализация ТAPI, в случае отсутствия устройства совместимого с установленными параметрами программа автоматически завершается. Далее в соответствии с выбранным интерфейсом пользователя или администратора происходит загрузка необходимых параметров, а также открытие базы данных.

При выборе интерфейса пользователя необходимо ввести его имя (например, Ф.И.О.). Итак, интерфейс пользователя выглядит следующим образом (рис 13):

                                           Рис 13

Табло состояния отражает события, на которые отвечает модем или им генерируются. Кнопки ‘Взять трубку’  и  ‘Положить трубку’ позволяет оператору выполнить в ручном режиме взятие и опускание трубки модема.

Панель набора номера необходима для исходящего звонка оператора. В окошке ‘Набираемый номер’ отражается номер, набранный с клавиатуры компьютера или с помощью мыши на экранной клавиатуре. Присутствуют также кнопки очистки номера, ‘Набрать номер’ – размещение запроса набора номера на модем, ‘Отмена’ – отмена запроса на набор номера (соединение).

Ниже указаны некоторые настройки программы  имя модема формат сжатия и его настройки, а также режим ожидания вызова (ручной, авто). ‘Место на диске’ – свободное место на диске в байтах, ‘Записано’ – количество записанных звуковых данных в байтах.

При выборе интерфейса администратора (рис 14) имеется возможность конфигурирования – вкладка ‘Конфигуратор’ или работы с базой данных – вкладка ‘База переговоров’.

                                      Рис 14

На вкладке ‘Конфигуратор’ устанавливаются следующие настройки:

·          кнопка ‘Выбор кодека’ – открывается визуальная форма выбора  (рис 15)

 

                          Рис 15

·       

·       

·       

·       

·       

·        config.ini

       На вкладке ‘База переговоров’ обеспечивается работа с базой данных диспетчерских переговоров (рис 16).

                                              Рис 16

         На рисунке 17 кнопка 1 обеспечивает отбор записей по диапазону дат указанному в окнах ‘C:’ и ‘по:’, кнопка 2 отменяет прежде установленный отбор, и кнопка 3 удаляет текущую запись из базы данных, а также обеспечивает физическое удаление файла со звуковыми данными с жесткого диска.

1

2

3

                                                    Рис 17

        На рисунке 18 указаны инструменты для проигрывания текущей записи.

Кнопка 1 позволяет проиграть запись или приостановить ее проигрывание.

Кнопка 2 останавливает запись и освобождает все  ресурсы, которые были использованы для нее. Элемент 3 отображает информацию о записи. Элемент 4 визуально показывает на каком этапе находится проигрывание записи.

2

1

3

4

                                               Рис 18

Итак,  в результате мы можем описать возможности системы кратко так:

  • Автоматическая запись всех телефонных разговоров
  • Проигрывание записанных сообщений через звуковую карту
  • Определение номера вызывающего абонента (для некоторых модемов) и ведение журнала звонков
  • Дружественный интерфейс программы позволяет сделать нужные настройки и облегчает работу пользователя.
  • Автоматическое или ручное (по выбору) управление модемом
  • Вы можете также конвертировать ваши записи в любой голосовой формат - MP3, WAV, и т.п.

4          

Запускаем программу в режиме администратор и устанавливаем следующие настройки (рис 19):

                                               Рис 19

То есть, выбираем запись звуковых данных без сжатия(PCM 8кГц, 16 бит, Моно). Далее запускаем программу в режиме пользователя и в результате минутного  разговора получаем файл размером 983130 байт.

Теперь запустим программу в режиме администратор и установим другие настройки (рис 20):

                                                Рис 20

Здесь установим речевой кодек – GSM 6.10 8кГц, Моно (16 бит – по умолчанию). Далее запускаем программу в режиме пользователя и в результате  разговора продолжительностью около минуты получаем файл размером 85610 байт.

Итак, в результате мы имеем коэффициент сжатия 983130/85610 = 11.48, что удовлетворяет требованиям, обозначенным в задании.

5      Экономическая часть

            План выполнения НИР

       Одной из основных целей планирования НИР является определение общей продолжительности их проведения. План выполнения данной НИР включает в себя перечень всех основных этапов и видов работ, которые должны быть выполнены, по каждому виду работ определяется квалификационный уровень исполнителей (должность), их число, трудоемкость и длительность выполнения каждой работы.

План выполнения данной НИР представлен в таблице 20.

Таблица 20

№ п.п.

Наименование этапа

Должность исполнителей

Трудоемкость, чел.-дни

Длительность

1

Согласование и утверждение технического задания (ТЗ) на НИР

Старший научный сотрудник (СНС)

2

2

Инженер

2

2

Подбор литературы.

Инженер

4

4

3

Разработка теоретической части вводного раздела

Инженер

2

2

4

Обзор методов сжатия звуковых данных

инженер

4

4

5

Разработка алгоритма

использования этих методов

инженер

6

6

6

Разработка программного продукта.

инженер

31

31

7

Экспериментальные исследования и доработка алгоритма

СНС

5

35

инженер

35

8

Оформление технического отчета

инженер

7

7

9

Сдача темы заказчику

СНС

1

2

инженер

2

ИТОГО:

93

            Составление сметы затрат и определение цены на НИР

Цена на НИР складывается из трех составляющих: прямые затраты, накладные расходы и прибыль.

Прямые затраты

Прямые затраты включают в себя заработную плату исполнителя и руководителя НИР, единый социальный налог, амортизационные отчисления.

Основная заработная плата лиц, непосредственно занятых выполнением НИР

Размер основной заработной платы исполнителей НИР (старшего научного сотрудника и инженера) приведен в таблице 2. Дневная заработная плата исполнителей (приведена там же) рассчитывается, исходя из месячной и известного числа рабочих дней в месяце (принимается равным 21).

Единый социальный налог (ЕСН)

ЕСН включают в себя отчисления в пенсионный фонд (20%), в фонд социального страхования (3.2%), в федеральный фонд обязательного медицинского страхования (0.8%), территориальный фонд обязательного медицинского страхования(2%).

Суммарный процент отчислений на социальные нужды составляет 26%.

Амортизационные отчисления.

Сроком полезного использования основного средства признается период, в течение которого объект основных средств служит для выполнения цели деятельности налогоплательщика. Срок полезного использования определяется налогоплательщиком самостоятельно на дату ввода в эксплуатацию данного объекта с учетом классификации основных средств, утверждаемой Правительством РФ (гл.25, ст.258, п.1 НК РФ).

ЭВМ отнесем к третьей амортизационной группе, со сроком полезного использования – 5 лет.

При начислении амортизации будем применять линейный метод. При использовании этого метода норма амортизации определяется по формуле (гл.25, ст.259, п.4 НК РФ):

                                       ,

где K – норма амортизации в процентах к первоначальной стоимости основного средства;

N – срок полезного использования основного средства, выраженный в месяцах.

Таким образом, отчисления на амортизацию ЭВМ составляют 20% от цены на ЭВМ в год. Поэтому для определения суммы амортизационных отчислений за время проведения НИР следует воспользоваться формулой

                                      

где ЦЭВМ – цена ЭВМ,

tДНЕЙ – время выполнения НИР (в днях),

260 – число рабочих дней в году.

Цена ЭВМ, используемой для написания и отладки программного продукта, составляет около 700 долларов США.

Накладные расходы.

Накладные расходы составляют 15% от прямых затрат. В них включается: заработная плата обслуживающего персонала лаборатории (в которой проводилась НИР), затраты на электроэнергию, плата за отопление и оплата услуг связи.

НР = ПЗ*15%

       Сумма прямых затрат и накладных расходов носит название сметной стоимости:

СС = ПЗ +НР

Прибыль

       Стандартная величина планируемой прибыли составляет в РГРТА 5% от сметной стоимости

Пр = СС*10%

       Сумма сметной стоимости и прибыли даст величину затрат на выполнение данной работы (или, другими словами, цену на НИР):

ЦНИР = СС + Пр

При определении сметы затрат и цены НИР все вычисления по упомянутым формулам велись с помощью программы Excel. В таблице 2 приведён протокол с результатами расчётов.

 

Таблица 21. Протокол расчета сметы затрат и цены НИР

 

            Оценка экономической эффективности НИР

 В данном дипломном проекте была разработана система регистрации речи диспетчерских переговоров. При создании системы был решен целый ряд проблем, которые позволят владельцу системы более эффективно организовать работу. Этими проблемами являются: возможность диспетчера отчитаться за требуемый период времени (запись разговора в файл и регистрация события в базе данных), проблема экономии места на жестком диске (сжатие звуковых данных), в техническом плане – освобождение рук оператора от трубки телефона (подключение телефонной гарнитуры к модему).

Выше сказанное позволяет судить об актуальности и говорит о возможности внедрения этой системы на предприятиях представляющих собой таксопарки.

Экономический эффект может быть достигнут вследствие, снижения стоимости аппаратных средств (за счет сжатия звуковых данных), а также в результате более эффективной организации работы диспетчера.

6      Безопасность и экологичность проекта.

             Вступление

Проблемы безопасности человека необходимо решать на всех стадиях жизненного цикла, будь то разработка, внедрение в жизнь или эксплуатация программы.

Так как основная часть дипломного проекта – разработка программы, осуществлялась с помощью ПЭВМ, которая является потребителем электроэнергии. Поэтому значение здесь имеет вопрос об экономном расходе данного вида ресурса. Но так ПЭВМ  является экологически чистым оборудованием, то основное внимание в данном разделе будет уделяться безопасности разработчика программы.

Обеспечение безопасности человека в значительной степени зависит от правильной оценки опасных, вредных производственных факторов. Одинаковые по тяжести изменения в организме человека могут быть вызваны различными причинами. Это могут быть какие-либо факторы производственной среды, чрезмерная физическая и умственная нагрузка, нервно-эмоциональное напряжение, а также разное сочетание этих причин.

В данной главе решаются  вопросы безопасной жизнедеятельности на стадии разработки программного и методического обеспечения.

Зал вычислительного центра (ВЦ), в котором производилась разработка дипломного проекта, имеет следующие параметры:

размеры помещения – 6 х 4 м;

высота потолка – 3.00 м;

количество рабочих мест с ПЭВМ – 6 (работают инженеры-программисты);

2 окна размером 2´2 м;

1 дверь размером 0.9´2.1 м.

Программисты работают на ПЭВМ мониторы, которых выполнены на базе ЭЛТ.

Питание электрооборудования осуществляется от трёхфазной сети переменного тока частотой 50 Гц напряжением 380/220 В с глухозаземленной нейтралью .

6.2 Анализ опасных и вредных факторов, воздействующих на разработчика при разработке данной системы.

Опасные   и   вредные   производственные      факторы    по природе   возникновения   делятся   на   следующие группы:

-физические;

-химические;

-психофизиологические;

-биологические.

В помещении ВЦ на программиста могут негативно действовать следующие физические факторы согласно ГОСТ 12.0.003-74*[1]:

-неблагоприятные параметры воздушной среды;

-недостаточная освещенность рабочего места;

-блескость экрана дисплея.

-превышающий допустимые нормы шум;

-повышенный уровень ионизирующего излучения;

-повышенный уровень электромагнитных полей;

-повышенный уровень статического электричества;

-мягкое рентгеновское излучение;

-ионизация воздуха;

-опасность поражения электрическим током;

К химически опасным факторам, постоянно действующим на программиста относятся следующие:

-возникновение,  в результате  ионизации  воздуха  при  работе компьютера, активных частиц.

Биологические вредные производственные факторы в данном помещении отсутствуют.

К психофизиологическим вредным факторам, воздействующим на оператора в течение его рабочей смены можно отнести следующие:

-нервно - психические перегрузки;

-физическая перегрузка мышц;

-монотонность труда;

-малая частота регенерации изображения.

Далее более подробно рассмотрены опасные и вредные факторы, воздействующие на    программиста, возникшие в связи с разработкой данной системы.

6.2.1 Микроклимат рабочей зоны разработчика.

Микроклимат производственных помещений - это климат внутренней   среды этих помещений, который определяется действующими на организм человека сочетаниями температуры, влажности и скорости движения воздуха.

Работа в ВЦ согласно СанПиН 2.2.2/2.4.1340-03[2] ( с энергозатратами до 120 ккал/час) относится к 1а категории, поэтому должны соблюдаться следующие требования:

-в холодный период года: температура 22-24°С, влажность воздуха 40-60%, скорость движения воздуха 0.1 м/с.

-в тёплый период года: температура 23-25°С, влажность воздуха 40-60%, скорость движения воздуха 0.1 м/с.

Для создания и автоматического поддержания в лаборатории независимо от наружных условий оптимальных значений температуры, влажности, чистоты и скорости движения воздуха, в холодное время года используется водяное отопление, в теплое время года применяется кондиционирование воздуха. Кондиционер представляет собой вентиляционную установку, которая с помощью приборов автоматического регулирования поддерживает в помещении заданные параметры воздушной среды.

6.2.2 Освещение рабочего места

Работа, выполняемая с использованием вычислительной техники, имеет следующие недостатки:

- вероятность появления прямой блескости;

- ухудшенная  контрастность между изображением  и фоном;

- отражение экрана.

-пульсация света.

В связи с тем, что естественное освещение слабое, на рабочем месте должно применяться также искусственное освещение.

Требования к искусственному освещению описаны в ГОСТ Р 50923-96[3]  и СанПиН 2.2.2/2.4.1340-03[2] для работников вычислительных центров.

Искусственное освещение в помещениях эксплуатации ПЭВМ осуществляется системой общего равномерного освещения.

В производственных и административно-общественных помещениях, в случаях преимущественной работы с документами, разрешено применение системы комбинированного освещения (к общему освещению дополнительно устанавливаются светильники местного освещения, предназначенные для освещения зоны расположения документов).

Освещенность на поверхности стола в зоне размещения рабочего документа должна быть 300-500 лк(оптимальная-400лк), также допускается установка светильников местного освещения для подсветки документов, но с таким условием, чтобы оно не создавало бликов на поверхности экрана и не увеличивало освещенность экрана более чем на 300 лк относительно оптимальной.

В качестве источников света при искусственном освещении должны применяться преимущественно люминесцентные лампы типа ЛБ. При устройстве отраженного освещения в административно-общественных помещениях допускается применение металлогалогенных ламп мощностью до 250 Вт. Допускается применение ламп накаливания в светильниках местного освещения.

Общее освещение следует выполнять в виде сплошных или прерывистых линий светильников, расположенных сбоку от рабочих мест, параллельно линии зрения пользователя при рядном расположении ПЭВМ. При периметральном расположении компьютеров линии светильников должны располагаться локализовано над рабочим столом, ближе к его переднему краю, обращенному к оператору.

Для обеспечения нормируемых значений освещенности в помещениях использования ПЭВМ следует проводить чистку стекол оконных рам и светильников не реже двух раз в год и проводить своевременную замену перегоревших ламп.

6.2.3 Воздействие шума на разработчика. Защита от шума.

В помещениях с низким уровнем общего шума, каким является ВЦ, где работает программист, источниками шумовых помех могут стать вентиляционные установки, кондиционеры и принтеры. Длительное воздействие этих шумов отрицательно сказываются на эмоциональном состоянии персонала, от чего увеличивается число ошибок и падает производительность труда.

Согласно ГОСТ Р 50923-96[3]  и СН 2.2.4/2.1.8.562-03[2] эквивалентный уровень звука не должен превышать 50 дБА, так как наше помещение расположено в жилом общественном здании.

В   качестве   мер   по   снижению   шума   можно   предложить следующее:

-облицовка потолка и стен звукопоглощающим материалом;

- экранирование рабочего места (постановкой перегородок);

- установка в компьютерных помещениях оборудования, производящего минимальный шум;

- рациональная планировка помещения.

Защиту от шума следует выполнять в соответствии с ГОСТ 12.1.029-80[5]

6.2.4 Опасность повышенного уровня напряженности электромагнитного поля.

Электромагнитные поля, характеризующиеся напряженностями электрических и магнитных полей, наиболее вредны для организма человек. Основным источником этих проблем, связанных с охраной здоровья людей, использующих в своей работе автоматизированные информационные системы на основе персональных компьютеров, являются дисплеи (мониторы), особенно дисплеи с электронно-лучевыми трубками. Они представляют собой источники наиболее вредных излучений, неблагоприятно влияющих на здоровье программиста.

Существуют два основополагающих стандарта в этой области: ГОСТ Р 50948-96[6]  и ГОСТ Р 50949-96[7] .

Ниже приведены нормы по электрическим и магнитным полям согласно СанПиН 2.2.2/2.4.1340-03[2].

-Напряжённость переменного электрического поля на расстоянии 50 см вокруг дисплея:

         в диапазоне частот 5 Гц – 2 Кгц: не более 25 В/м;

         в диапазоне частот2 Кгц – 400 Кгц: не более 2.5 В/м.

-Плотность магнитного потока (магнитная индукция):

         в диапазоне частот 5 Гц – 2 Кгц: не более 250 нТл;

         в диапазоне частот2 Кгц – 400 Кгц: не более 25 нТл.

-         Напряженность электростатического поля  не более 15 кВ/м.

ГОСТ Р 51658-2000[14] - стандарт устанавливает  требования к визуальным параметрам защитных фильтров, параметрам экранировки по электростатическому и переменным электрическим полям.

Поля, порождённые посторонними источниками (фоновые поля), определяются физическими особенностями этих источников и положением их по отношению к рабочему месту. Часто фоновые поля имеют общий источник – сеть электропитания, дающую существенный вклад на частоте 50 Гц и её гармониках. Этот вклад во многом зависит от правильности организации электросети и контура зануления, удалённости и расположения рабочего места относительно розеток питания и других элементов сети. Особого внимания требуют случаи появления экстремальных полей посторонних источников, которые могут не только многократно превышать гигиенические требования, но и нарушать нормальную работу ПЭВМ. Исследование причин появления экстремальных полей, путей их снижения и устранения требует привлечения специализированных организаций, имеющих опыт решения таких задач и необходимую для этого аппаратуру.

6.2.5 Электробезопасность. Статическое электричество.

Питание электрооборудования осуществляется от трёхфазной сети переменного тока частотой 50 Гц напряжением 380/220 В с глухозаземленной нейтралью.

На рабочем месте программиста из всего оборудования металлическим является лишь корпус системного блока компьютера, но здесь используются системные блоки, отвечающие стандарту фирмы IBM, в которых кроме рабочей изоляции предусмотрен элемент для заземления и провод с зануляющей жилой для присоединения к источнику питания. Таким образом, оборудование выполнено по классу 1 ГОСТ 12.2.007.0-75* [8].

Опасное и вредное воздействие на людей электрического тока, электрической дуги и электромагнитных полей проявляется в виде профессиональных заболеваний.

Рассмотрим основные причины поражения программиста электрическим током на рабочем месте:

- Прикосновение к металлическим нетоковедущим частям (корпусу, периферии компьютера), которые могут оказаться под напряжением в результате повреждения изоляции.

- Нерегламентированное использование электрических приборов.

- Отсутствие   инструктажа   сотрудников   по   ПТЭ и ПТБ[17].

Обеспечение электробезопасности техническими способами и средствами

Так как все токоведущие части ЭВМ изолированы, то случайное прикосновение в процессе работы программиста к токоведущим частям исключено.

Для обеспечения дополнительной защиты от поражения электрическим током при прикосновении к металлическим нетоковедущим частям, которые могут оказаться под напряжением в результате повреждения изоляции,  рекомендуется применять защитное зануление.

Зануление металлических частей системного блока ЭВМ обеспечено подведением зануляющей жилы к питающим розеткам. Сопротивление заземления нейтрали 4 Ом, согласно ПУЭ-03[15]  для электроустановок с напряжением до 1000 В.

Организационные и технические мероприятия по обеспечению электробезопасности

Основным организационным мероприятием является инструктаж и обучение безопасным методам труда, а так же проверка знаний правил безопасности и инструкций в соответствии с занимаемой должностью применительно к выполняемой работе.

При проведении незапланированного и планового ремонта вычислительной техники выполняются следующие действия:

- Отключение компьютера от сети

- Проверка отсутствия напряжения

После выполнения этих действий проводится ремонт неисправного оборудования. Ремонт необходимо производить в специально оборудованном помещении.

Если ремонт проводится на токоведущих частях, находящихся под напряжением, то выполнение работы проводится не менее чем двумя лицами с применением электрозащитных средств.

6.3 Организация рабочего места разработчика.

Производственная деятельность программиста, заставляет его продолжительное время находиться в сидячем положении, которое является вынужденной позой, поэтому организм постоянно испытывает недостаток в подвижности и активной физической деятельности. При выполнении работы, сидя, большую роль играет плечевой пояс. Перемещение рук в пространстве влияет не только на работу мышц плечевого пояса и спины, но и на положение позвоночника, таза и даже ног.

Чтобы исключить возникновение заболеваний необходимо иметь возможность свободной перемены поз. Необходимо соблюдать режим труда и отдыха с перерывами, заполняемыми "отвлекающими" мышечными нагрузками на те звенья опорно-двигательного аппарата, которые не включены в поддержание основной рабочей позы. (ГОСТ Р 50923-96[3] )

Антропологические характеристики человека определяют габаритные и компоновочные параметры его рабочего места, а также свободные параметры отдельных его элементов.

По условиям работы рабочее место программиста относится к индивидуальному рабочему месту для работы сидя.

Рабочее место программиста согласно СанПиН 2.2.2/2.4.1340-03[2] должно занимать площадь не менее 6 м2 на одного человека, так как используются мониторы на базе ЭЛТ.

После проведения анализа рабочего места программиста в ВЦ было выяснено, что площадь данного рабочего места составляет 4 м2, что не соответствует приведенным требованиям. Также в результате анализа были выявлены нарушения в организации непосредственно самого рабочего места программиста. В связи с этим предлагается организовать рабочее место программиста, следующим образом. Высота над уровнем пола рабочей поверхности, за которой работает программист, должна составлять 720 мм. Желательно, чтобы рабочий стол программиста при необходимости можно было регулировать по высоте в пределах 680 - 780 мм. Оптимальные размеры поверхности стола 1600 х 1000 кв. мм. Под столом должно иметься пространство для ног с размерами по глубине 650 мм. Рабочий стол оператора должен также иметь подставку для ног, расположенную под углом 15° к поверхности стола. Длина подставки 400 мм, ширина-350 мм. Удаленность клавиатуры от края стола должна быть не более 300 мм, что обеспечит оператору удобную опору для предплечий. Расстояние между глазами оператора и экраном видеодисплея должно составлять 40 - 80 см.

Рабочий стул программиста должен быть снабжен подъемно-поворотным механизмом. Высота сиденья должна регулироваться в пределах 400 - 500 мм. Глубина сиденья должна составлять не менее 380 мм, а ширина не менее 400 мм. Высота опорной поверхности спинки не менее 300 мм, ширина - не менее 380 мм. Угол наклона спинки стула к плоскости сиденья должен изменяться в пределах 90 - 110°.

6.4 Анализ пожарной безопасности

Степень огнестойкости зданий принимается в зависимости от их назначения, категории по взрывопожарной и пожарной опасности, этажности, площади этажа в пределах пожарного отсека.

Общие требования по пожарной безопасности регламентируются ГОСТ 12.1.004-91[10].

Здание, в котором находится ВЦ, по пожарной опасности строительных конструкций относится к категории К1 (малопожароопасное), поскольку здесь присутствуют горючие (книги, документы, мебель, оргтехника и т.д.) и трудносгораемые предметы (сейфы, различное оборудование и т.д.).

По конструктивным характеристикам здание можно отнести к зданиям с несущими и ограждающими конструкциями из естественных или искусственных каменных материалов, бетона или железобетона, где для перекрытий допускается использование деревянных конструкций, защищенных штукатуркой или трудногорючими листовыми, а также плитными материалами.

Следовательно, степень огнестойкости здания можно определить как третью (III). ГОСТ Р 22.7.01-99[11], СНиП 2.04.09-84[12].

Помещение ВЦ по функциональной пожарной опасности относится к классу Ф 4.3 - учреждения органов управления, проектно-конструкторские организации, информационные и редакционно-издательские организации, научно-исследовательские организации, банки, конторы, офисы; СНиП 21-01-97[13].

Для предотвращения возникновения пожара на рабочем месте необходимо соблюдение правил пожарной безопасности (ППБ 01-03[16]), кроме того, действует федеральный закон «О пожарной безопасности» № 69-ФЗ (от 21.12.1994г.).

Пожарная профилактика представляет собой комплекс организационных и технических мероприятий, направленных на обеспечение безопасности людей, на предотвращении пожара, ограничение его распространения, а также создание условий для успешного тушения пожара. Для профилактики пожара чрезвычайно важна правильная оценка пожароопасности здания, определение опасных факторов и обоснование способов и средств пожаропредупреждения и защиты ППБ 01-03[16].

Одно из условий обеспечения пожаробезопасности -  ликвидация возможных источников воспламенения.

В ВЦ источниками воспламенения могут быть:

-неисправное электрооборудование, неисправности в электропроводке, электрических розетках и выключателях. Для исключения возникновения пожара по этим причинам необходимо вовремя выявлять и устранять неисправности, проводить плановый осмотр и своевременно устранять все неисправности;

-неисправные электроприборы. Необходимые меры для исключения пожара включают в себя своевременный ремонт электроприборов, качественное исправление поломок, не использование неисправных электроприборов;

-обогревание помещения электронагревательными приборами с открытыми нагревательными элементами. Открытые нагревательные поверхности могут привести к пожару, так как в помещении находятся бумажные документы и справочная литература в виде книг, пособий, а бумага легковоспламеняющийся предмет. В целях профилактики пожара предлагается не использовать открытые обогревательные приборы в помещении ВЦ.

- несоблюдение мер пожарной безопасности, и курение в помещении также может привести к пожару. Для устранения возгорания в результате курения в помещении ВЦ предлагается категорически запретить курение, а разрешить только в строго отведенном для этого месте.

В целях предотвращения пожара предлагается проводить с инженерами, работающими в ВЦ, противопожарный инструктаж, на котором ознакомить работников с правилами противопожарной безопасности, а также обучить использованию первичных средств пожаротушения.

В случае возникновения пожара необходимо отключить электропитание, вызвать по телефону пожарную команду, эвакуировать людей из помещения согласно плану эвакуации и приступить к ликвидации пожара огнетушителями. При наличии небольшого очага пламени можно воспользоваться подручными средствами с целью прекращения доступа к объекту возгорания.

Для тушения пожаров на начальных стадиях широко применяются огнетушители. По виду используемого огнетушащего вещества огнетушители подразделяются на следующие основные группы.

Пенные огнетушители, применяются для тушения горящих жидкостей, различных материалов, конструктивных элементов и оборудования, кроме электрооборудования, находящегося под напряжением.

Газовые огнетушители применяются для тушения жидких и твердых веществ, а также электроустановок, находящихся под напряжением.

К системам сигнализации предъявляются следующие технические требования: они должны иметь минимальную инерционность сработки, обеспечивать заданную достоверность информации, отсутствие ошибочной сработки; быть надежными в работе при всех условиях эксплуатации, обеспечивать автономное включение сигнала тревоги.

Основными элементами пожарной сигнализации являются:

датчики пожарной сигнализации, которые размещаются в наиболее пожаро- и взрывоопасных местах;

электронно-усилительный блок, который обеспечивает дистанционный контроль за состоянием датчиков;

исполнительный блок, с помощью которого включается первый рубеж противопожарной системы и блок сигнализации.

Датчики – наиболее важный элемент системы сигнализации, который в основном определяет возможности и характеристики системы в целом.

В качестве пожарных извещателей выбираем 10 тепловых датчиков типа ИП-103М-5АС; в качестве средств пожаротушения – один углекислотный огнетушитель ОУ-5, в силу условий, приведенных выше.

6.5  Расчет искусственного освещения

Конечной целью расчёта искусственного освещения является определение типа, числа и расположения светильников, а также типа, числа и мощности ламп, необходимых для обеспечения требуемого нормативного уровня освещенности.

Расчёт освещения производился в системе MathCAD 2000. Помещение имеет следующие характеристики:

Нормативные уровни освещенности рабочего места осуществляются согласно СНиП 23-05-95[19] .

Eнорм – нормированная минимальная освещенность для нашего помещения равна 300 лк.

Показатель ослепленности P= 20 %

Коэффициент пульсаций освещенности Kп= 15 %

Для искусственного освещения рабочих мест с ПЭВМ следует использовать люминесцентные лампы, имеющие высокую световую отдачу (до 75 лм/Вт и более), большой срок службы (до 10000 ч), малую яркость светящейся поверхности, а также близкий к естественному спектр излучения, что обеспечивает хорошую цветопередачу. Наиболее целесообразным для применения освещения рабочих мест с ПЭВМ  рекомендуются люминесцентные лампы 36-65 Вт типа ЛБ (белого цвета) или лампы типа ЛТБ (тёпло-белого цвета) мощностью 20 или 40 Вт.

При питании газоразрядных ламп от сети переменного тока осветительные установки кроме нормативных условий освещенности должны также удовлетворять требованию приемлемого уровня пульсаций освещенности.

В связи с тем, что в люминесцентных лампах пульсации генерируемого светового потока существенно сглаживаются люминофором, покрывающим внутреннюю поверхность трубчатой колбы, можно считать, что при их использовании требования к коэффициенту пульсаций удовлетворяются автоматически .

Выбирая систему освещения, необходимо учитывать, что более эффективной является система комбинированного освещения, но система общего освещения более гигиенична, т.к. обеспечивает большую равномерность освещенности рабочих поверхностей, поэтому остановимся на последней.

Тип светильников определяется с учётом требований к освещению данного помещения, по экономическим показателям, а также в зависимости от условий среды и требований взрыво- и пожаробезопасности. Таким образом, конструктивное исполнение светильников должно соответствовать условиям окружающей среды: влажности, запыленности, пожаро- и взрывоопасности и другим особенностям производства.

Расположение светильников оказывает существенное влияние на экономичность, качество и удобство эксплуатации системы освещения и должно обеспечивать заданные уровни освещённости на всех рабочих местах при наименьшей мощности установленных ламп. Это возможно благодаря выбору наивыгоднейшего соотношения между расстоянием между рядами светильников и высотой подвеса светильника над рабочей поверхностью.

Поскольку мощность люминесцентных ламп и их количество в светильнике известны, то расчёт числа светильников будем вести по формуле (1) .

7        Заключение

В данном дипломном проекте была разработана система регистрации речи диспетчерских переговоров. При создании системы был решен целый ряд проблем, которые позволят владельцу системы более эффективно организовать работу. Этими проблемами являются: возможность диспетчера отчитаться за требуемый период времени (запись разговора в файл и регистрация события в базе данных), проблема экономии места на жестком диске (сжатие звуковых данных), в техническом плане – освобождение рук оператора от трубки телефона (подключение телефонной гарнитуры к модему).

 Использование данной системы возможно только в том случаи, если установлен механизм работы с базой данных – BDE, а также желательно наличие ОС WidowsXP.

Возможно, также исправление узких мест системы, если таковые обнаружатся в ходе использования данной системы или же может иметь место увеличение производительности системы в плане повышения функциональности (например, добавления возможности распечатки отчетов и т. д.)

Список литературы

1.     ГОСТ 12.0.003-74 “ОПАСНЫЕ И ВРЕДНЫЕ ПРОИЗВОДСТВЕННЫЕ ФАКТОРЫ. Классификация”

2.     СанПиН 2.2.2.542-03 “Гигиенические требования к персональным электронно-вычислительным машинам и организации работы”

3.     ГОСТ Р 50923-96  “Дисплеи. Рабочее место оператора. Общие эргономические требования и требования к производственной среде. Методы измерения.”

4.     СН 2.2.4/2.1.8.562-03  “Шум на рабочих местах в помещениях жилых общественных зданий и на территории жилой застройки”

5.     ГОСТ 12.1.029-80  “Средства и методы защиты от шума. Классификация”

6.     ГОСТ Р 50948-96  “Средства отображения информации индивидуального пользования. Общие эргономические требования и требования безопасности”

7.     ГОСТ Р 50949-96  “Средства отображения информации индивидуального пользования. Методы измерения и оценки эргономических параметров и параметров безопасности”

8.     Гост 12.2.007.0-75* “ИЗДЕЛИЯ ЭЛЕКТРОТЕХНИЧЕСКИЕ.Общие требования безопасности”

9.     ГОСТ 12.1.019-79 “Электробезопасность. Общие требования и номенклатура видов защиты”

10.                       ГОСТ 12.1.004-91 “ПОЖАРНАЯ БЕЗОПАСНОСТЬ”

11.                       ГОСТ Р 22.7.01-99 “Безопасность в чрезвычайных ситуациях. Единая дежурно-диспетчерская служба. Основные положения”

12.                       СНиП 2.04.09-84 “ПОЖАРНАЯ АВТОМАТИКА ЗДАНИЙ И СООРУЖЕНИЙ”

13.                       СНиП 21-01-97 “ПОЖАРНАЯ БЕЗОПАСНОСТЬ ЗДАНИЙ И ОРУЖЕНИЙ”

14.                       ГОСТ Р 51658-2000 "Фильтры-экраны защитные для средств отображения информации. Типы, основные параметры и методы измерений". 

15.                       ПУЭ-03 “Правила устройства электроустановок”

16.                       ППБ 01-03  “Правила пожарной безопасности”

17.                       ПТЭ и ПТБ “Правила технической эксплуатации электрических станций и сетей РФ” и “Правила техники безопасности при эксплуатации электрических станций и сетей РФ”

18.                       Материалы по Delphi на сайте http://www.delphikingdom.com (сеть Internet)

19.                       П.Дарахвелидзе, Е.Марков “Программирование в Delphi7” СПб.: БХВ-Петербург, 2004

20.                       С.Бобровский “Delphi7. Учебный курс” СПб.: Питер, 2004

21.                       В. Никамин. "Форматы цифровой звукозаписи". СПб.: Элби, 1998

22.                       Н. Секунов. "Обработка звука на PC". - СПб.: БХВ-Петербург, 2001

23.                       8. Д. Смирнов, О. Логутенко. "Аудиосистема РС". СПб.: БХВ-Петербург, 1999

24.                       И. Кузнецов “Обзор возможностей системы Audio Compression Manager (ACM)”

25.                       Е. Музыченко. "Подсистема сжатия звука в Windows". Компьютер-Пресс, №7-2000

26.                       Е. Музыченко. " Обработка звуковых файлов в Windows". Компьютер-Пресс, №8-2000

27.                       “Acorp-EMSF2 V90\V92 modem. Руководство пользователя”  DdiX Labs. 2002

28.                       “Telephony Application Programming Interface (TAPI) Programmer's Reference” 1995-1996 Microsoft Corporation. All rights reserved

29.                       “MSDN Library - October 2004” Microsoft Corporation. All rights reserved

30.                        Материалы по TAPI на сайте http://www.delphiclub.de (сеть Internet)

Приложение 1

Исходный текст программы

program SysWave;

uses

  Forms,

  main in 'main.pas' {SysWaves},

  DataMode in 'DataMode.pas' {DataModule1: TDataModule},

  About in 'About.pas' {Abouts},

   VarTo in 'VarTo.pas' {VarS};

{$R *.res}

begin

  Application.Initialize;

  Application.CreateForm(TSysWaves, SysWaves);

  Application.CreateForm(TDataModule1, DataModule1);

  Application.CreateForm(TAbouts, Abouts);

  Application.CreateForm(TVarS, VarS);

  Application.Run;

end.

Главный модуль

unit main;

interface

uses

  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,

  Dialogs, Menus, ComCtrls, StdCtrls, XPMan, Buttons,IniFiles, Mask,mmSystem,

  Grids, DBGrids,DataMode, ExtCtrls,About, TAPITon, TAPIAddress,MSAcm,

  TAPIDevices, TAPICall, TAPILines, TAPISystem, DevConf, TAPIServices,

  TAPILineSelectDialog, TAPIWave,VarTo, TAPIPhone;

type

  TRecorderMode = (recModeOff, recModeRecord, recModePlay);

  TSysWaves = class(TForm)

    PageControl1: TPageControl;

    TabSheet1: TTabSheet;

    TabSheet2: TTabSheet;

    MainMenu1: TMainMenu;

    exit1: TMenuItem;

    GroupBox2: TGroupBox;

    TabSheet3: TTabSheet;

    XPManifest1: TXPManifest;

    SaveConf: TBitBtn;

    DBGrid1: TDBGrid;

    Play: TBitBtn;

    Answer: TBitBtn;

    DisplayMemo: TMemo;

    HandsetDown: TBitBtn;

    GroupBox3: TGroupBox;

    Panel1: TPanel;

    SpeedButton1: TSpeedButton;

    SpeedButton2: TSpeedButton;

    SpeedButton3: TSpeedButton;

    SpeedButton4: TSpeedButton;

    SpeedButton5: TSpeedButton;

    SpeedButton6: TSpeedButton;

    SpeedButton7: TSpeedButton;

    SpeedButton8: TSpeedButton;

    SpeedButton9: TSpeedButton;

    SpeedButton10: TSpeedButton;

    DialNo: TBitBtn;

    CancelNo: TBitBtn;

    GroupBox4: TGroupBox;

    CallNo: TEdit;

    About1: TMenuItem;

    TAPICall1: TTAPICall;

    TAPILine1: TTAPILine;

    CallParams1: TCallParams;

    TAPILineDevice1: TTAPILineDevice;

    TAPIAddress1: TTAPIAddress;

    TAPILineDeviceConfig1: TTAPILineDeviceConfig;

    TAPILineService1: TTAPILineService;

    Bevel1: TBevel;

    Timer1: TTimer;

    FormatTagLabel: TLabel;

    FormatDescLabel: TLabel;

    Label6: TLabel;

    Label7: TLabel;

    LengthDispLabel: TLabel;

    LengthPosLabel: TLabel;

    TrackBar1: TTrackBar;

    Label8: TLabel;

    Label9: TLabel;

    Label10: TLabel;

    Label11: TLabel;

    Bevel2: TBevel;

    DelTrack: TSpeedButton;

    Stop: TBitBtn;

    GroupBox5: TGroupBox;

    Bevel3: TBevel;

    GetFormatTag: TLabel;

    GetFormatDesc: TLabel;

    GetFormat: TBitBtn;

    GroupBox6: TGroupBox;

    Label3: TLabel;

    MaskEdit1: TMaskEdit;

    CheckBox1: TCheckBox;

    GroupBox1: TGroupBox;

    RadioButton1: TRadioButton;

    RadioButton2: TRadioButton;

    Timer2: TTimer;

    FTLabel: TLabel;

    FDLabel: TLabel;

    ClearNo: TSpeedButton;

    Label1: TLabel;

    MaskEdit2: TMaskEdit;

    Bevel4: TBevel;

    ModemName: TLabel;

    Label2: TLabel;

    Label4: TLabel;

    Timer3: TTimer;

    DevName: TLabel;

    GroupBox7: TGroupBox;

    DateTimePicker1: TDateTimePicker;

    DateTimePicker2: TDateTimePicker;

    Label5: TLabel;

    Label12: TLabel;

    Select: TSpeedButton;

    NoSelect: TSpeedButton;

    TAPIPhoneService1: TTAPIPhoneService;

    TAPIPhoneDevice1: TTAPIPhoneDevice;

    TAPIPhone1: TTAPIPhone;

    SpeedButton11: TSpeedButton;

    SpeedButton12: TSpeedButton;

    GroupBox9: TGroupBox;

    HeadSetVolume: TProgressBar;

    HeadSetGain: TProgressBar;

    HandSetVolume: TProgressBar;

    HandSetGain: TProgressBar;

    HeadSetVolUpDown: TUpDown;

    HeadSetGainUpDown: TUpDown;

    HandSetVolUpDown: TUpDown;

    HandSetGainUpDown: TUpDown;

    Image1: TImage;

    Image2: TImage;

    Label13: TLabel;

    Label14: TLabel;

    Label15: TLabel;

    Label16: TLabel;

    procedure SaveConfClick(Sender: TObject);

    procedure PlayClick(Sender: TObject);

    procedure FormDestroy(Sender: TObject);

    procedure FormShow(Sender: TObject);

    procedure About1Click(Sender: TObject);

    procedure DialNoClick(Sender: TObject);

    procedure SpeedButton1Click(Sender: TObject);

    procedure SpeedButton2Click(Sender: TObject);

    procedure SpeedButton3Click(Sender: TObject);

    procedure SpeedButton4Click(Sender: TObject);

    procedure SpeedButton5Click(Sender: TObject);

    procedure SpeedButton6Click(Sender: TObject);

    procedure SpeedButton7Click(Sender: TObject);

    procedure SpeedButton8Click(Sender: TObject);

    procedure SpeedButton9Click(Sender: TObject);

    procedure SpeedButton10Click(Sender: TObject);

    procedure CancelNoClick(Sender: TObject);

    procedure TAPICall1StateConnected(Sender: TObject;

      ConnectedMode: TLineConnectedModes; Rights: TLineCallPrivilege);

    procedure TAPICall1StateDisconnected(Sender: TObject;

      DisconnectedMode: TLineDisconnectMode; Rights: TLineCallPrivilege);

    procedure TAPICall1StateProceeding(Sender: TObject;

      Rights: TLineCallPrivilege);

    procedure TAPILineDevice1StateRinging(Sender: TObject; RingModeIndex,

      RingCounter: Cardinal);

    procedure TAPICall1InfoCallerId(Sender: TObject);

    procedure exit1Click(Sender: TObject);

    procedure AnswerClick(Sender: TObject);

    procedure GetFormatClick(Sender: TObject);

    procedure StopClick(Sender: TObject);

    procedure Timer1Timer(Sender: TObject);

    procedure SpeedButton11Click(Sender: TObject);

    procedure ClearNoClick(Sender: TObject);

    procedure RadioButton1Click(Sender: TObject);

    procedure TAPILineDevice1StateReMoved(Sender: TObject);

    procedure Timer3Timer(Sender: TObject);

    procedure HandsetDownClick(Sender: TObject);

    procedure SelectClick(Sender: TObject);

    procedure NoSelectClick(Sender: TObject);

    procedure DelTrackClick(Sender: TObject);

    procedure FormClose(Sender: TObject; var Action: TCloseAction);

    procedure TAPICall1Reply(Sender: TObject; AsyncFunc: TAsyncFunc;

      Error: Cardinal);

    procedure SpeedButton12Click(Sender: TObject);

    procedure TAPICall1StateBusy(Sender: TObject; BusyMode: TLineBusyMode;

      Rights: TLineCallPrivilege);

    procedure HeadSetVolUpDownChangingEx(Sender: TObject;

      var AllowChange: Boolean; NewValue: Smallint;

      Direction: TUpDownDirection);

    procedure HeadSetGainUpDownChangingEx(Sender: TObject;

      var AllowChange: Boolean; NewValue: Smallint;

      Direction: TUpDownDirection);

    procedure HandSetVolUpDownChangingEx(Sender: TObject;

      var AllowChange: Boolean; NewValue: Smallint;

      Direction: TUpDownDirection);

    procedure HandSetGainUpDownChangingEx(Sender: TObject;

      var AllowChange: Boolean; NewValue: Smallint;

      Direction: TUpDownDirection);

    procedure TAPICall1StateOffering(Sender: TObject;

      OfferingMode: TLineOfferingModes; Rights: TLineCallPrivilege);

    procedure TAPICall1StateIdle(Sender: TObject;

      Rights: TLineCallPrivilege);

    procedure Button1Click(Sender: TObject);

    procedure Button2Click(Sender: TObject);

  private

    { Private declarations }

    FPulse         : boolean;{признак импульсного набора номера}

    FAutoAnswer    : boolean;{признак автоответа модема}

    ConfigFile     : TIniFile;{переменная инициализационного файла}

    FTimeReg       : integer;{Время регистрации}

    FTimeCounter   : integer;{счетчик времени}

    VG             : array[1..4] of integer;{массив с настройками телефонной

                                            гарнитуры}

{******************Для работы со звуковыми данными*************************************************************}

    FWaveInID      : DWORD;{индификатор Wave устройства}

    FWaveFormat    : PWAVEFORMATEX;{указатель на структуру ТWAVEFORMATEX

                                   (формата звуковых данных)}

    FTotalWaveSize : DWORD;{ Номер записанных выборок }

    FByteDataSize  : DWORD;{ Накапливаемый размер записанных данных}

    FDiskFreeSpace : DWORD;{Свободное пространство для временного файла }

    FWaveHdr       : array [0..1] of PWAVEHDR;{ Точки доступа к wav информации

                                              заголовка}

    FWaveMem       : array [0..1] of PChar;{Точки доступа к wav буферам }

    FBufIndex      : Integer;{ Номер буфера который добавляется для использования}

    FWaveIn        : HWAVEIN;//Маркер{Дескриптор} устройства для того, чтобы

                             //делать запись

    FWaveOut       : HWAVEOUT;//Маркер{Дескриптор} устройства для проигрывания звука

    FMaxFmtSize    : DWORD;// наибольший размер формата, требуемый для сжатия

    FFormatDesc    : String;// Описание формата

    FFormatTag     : String;// Описание тэга формата

    FDeviceOpened  : Boolean;// состояние  открытия  устройства

    FRecorderMode  : TRecorderMode;//Режим рекордера

                                   //записи/проигрывания/не активности

    FWaveBufSize   : DWORD;// Размер буфера

    FFilename      : String;// Имя файла, чтобы сохранить WAV

    FMoreToPlay    : Boolean; //признак наличия звуковых данных, чтобы проигрывать

    FRecordedData  : Boolean;// мы сделали запись данных

    FTmpFileName   : String;//имя временного WAV файла

    FTmpFileHandle : HFILE; // Маркер{Дескриптор} к временному WAV файлу

//==============работа с временым файлом========================================

    function  OpenTmpFile : Integer; // Открытие временного файла для чтения.

    function  CreateTmpFile : integer; // Создание временного файла чтобы писать

                                       //wav данные.

    procedure DeleteTmpFile; // Удаление временного wav файла.

    procedure CloseTmpFile; // Закрытие временного файла содержащего недавно

                            //записаные данные.

//==================работа с записью============================================

    procedure StopWaveRecord;// Остановка записи.

    function  StartWaveRecord : Integer;// Подготовка заголовков, добавление

                                        //буфера, подготовка показа, и начало записи.

    procedure InitWaveHeaders;// Обнуляет заголовки wav и инициализирует

                              //указатели данных и буферные длины

    procedure CloseWaveDeviceRecord;//Закрытие временного файл  и устройства,

                                    //делающего запись.

    procedure UpdateLength(BytePosition : DWORD; BytePositiontotal : DWORD);//

                                   // Обновление на экране числа записанных байт

    function  AddNextBuffer : integer;// Добавление буфера к очереди и

                                      //переключение индекса буфера

    procedure UpdateRecordDisplay;// обновления количества записанных байтов

//================сохранение файла==============================================

    function  SaveWaveFile : integer;// Сохранение wav файла

    procedure WFerror(mmfp : HMMIO; const msg : String); // Закрытие wav файла,

                                                       //вывод сообщения об ошибках

    function  CopyDataToWaveFile(mmfp : HMMIO) : integer;// Копирование wav данных

                                                 //из временного файла в wav файл

//======================получение и установка кодеков===========================

    function  GetWaveFormat : integer;  //функция вызывающая визуальный выбор кодека

    function  GetFormatTagDetails(wFormatTag : WORD) : integer; // Получение

                       //подробности тэга формата, и сохранение строкового описания.

//=========================инициализация========================================

    function  InitWaveRecorder : integer;//Размещение формата и заголовков wav,

                              //буфера данных, и получение временного имени файла

    function  AllocWaveFormatEx : Integer;//Размещение и захват структуры WAVEFORMATEX,

                         //основанную на максимальном размере формата согласно ACM.

    function  GetFormatDetails(pfmtin : PWAVEFORMATEX) : integer; // Получение

                           //подробности формата, и сохранение строкового описания.

    function  AllocWaveHeader : integer; //размещение в памяти заголовка wave

    function  AllocPCMBuffers : Integer;//размещение wave буфера в памяти

//========================завершение============================================

    procedure DestroyWaveRecorder; // Освобождение памяти, связанной с буферами wav.

    procedure FreeWaveFormatEx; // Освобождение WAVEFORMATEX буфера

    procedure FreeWaveHeader;  //Освобождение памяти заголовка wav.

    procedure FreePCMBuffers; //Освобождение памяти wav.

//===================проигрывание звука=========================================

    function  ReadWaveFile : Integer;//Чтение wav файла

    function  CopyWaveToTempFile(mmfp : HMMIO; datasize : DWORD) : Integer;//

                          //Копирование данных  из wav файла RIFF во временый файл.

    function  StartWavePlay : Integer;//Подготовка заголовков, добавление буферов,

                                                           //и начало проигрывания.

    procedure StopWavePlay; //остановка проигрывания wav файла

    procedure CloseWaveDevicePlay; // закрытие устройства проигрывания

    function  QueueNextBuffer : Integer;// Запись из буфера в wav устройство и

                                        //переключение индекса буфера .

    function  ReadWaveBuffer : Integer;// Чтение куска wav из временного файла

//====================работа с сообщениями wave=================================

    procedure MMWimData(var msg: TMessage); message MM_WIM_DATA;  //вызывается

    //если устройство завершило передачу данных в блок памяти, установленный

    //процедурой waveInAddBuffer;

    procedure MMWomDone(var msg: TMessage); message MM_WOM_DONE; // Сделать

    //проигрывание очередного волнового буфера, если проигран предыдущий.

    procedure MMWomClose(var msg: TMessage); message MM_WOM_CLOSE;// посылается,

    //когда устройство закрывается функцией waveOutClose;

    function  WriteWaveBuffer(size : UINT) : integer; // Запись записаных даных

    //в временый файл

{*******************************************************************************************************************************}

    procedure Display(Msg : String); // выводит сообщение Msg на  DisplayMemo

    procedure errormsg(msg : String); // Отобразите сообщение об ошибках.

  public

    { Public declarations }

  end;

 const

{Тип FOURCC

Описывает коды, используемых в формате RIFF (Resource Interchange File Format -

формат файлов обмена ресурсами). }

  WAVE_BUFSIZE  = 32768;

  FOURCC_WAVE   = $45564157;   { 'WAVE' }

  FOURCC_FMT    = $20746d66;   { 'fmt ' }

  FOURCC_FACT   = $74636166;   { 'fact' }

  FOURCC_DATA   = $61746164;   { 'data' }

 

var

  SysWaves: TSysWaves;

implementation

{$R *.dfm}

{*********************обработка формы SysWaves**********************************************}

//при создании формы и всей проги

procedure TSysWaves.FormShow(Sender: TObject);

var

v:variant;

begin

  FRecorderMode  := recModeOff;//режим рекордера устанавливаем 'нет режима записи'

//если функция "Разместите формат и заголовки волны, буфера данных, и временное имя файла" <> 0

  if InitWaveRecorder <> 0 then Application.Terminate;//то завершить программу

//проверяет наличие файла config.ini

  if FileExists(IncludeTrailingBackslash(ExtractFilePath(Application.ExeName))+'config.ini') then begin

  //создает или открывает конфигурационный файл

    ConfigFile:=TIniFile.Create(IncludeTrailingBackslash(ExtractFilePath(Application.ExeName))+'config.ini');

//проверяет наличие в config.ini разделов WaveFormat и DeviceMode,  VolGain

    if (ConfigFile.SectionExists('WaveFormat')=false) and  (ConfigFile.SectionExists('DeviceMode')=false) and (ConfigFile.SectionExists('VolGain')=false) then begin

//принудительно устанавливает режим администратора

      VarS.RadioButton1.Checked:=false;

      VarS.RadioButton2.Checked:=true;

      VarS.RadioButton1.Enabled:=false;

      VarS.UserName.Enabled:=false;

    end;

    ConfigFile.Free;

  end

  else begin

//принудительно устанавливает режим администратора

    VarS.RadioButton1.Checked:=false;

    VarS.RadioButton2.Checked:=true;

    VarS.RadioButton1.Enabled:=false;

    VarS.UserName.Enabled:=false;

  end;

//выбор прав и интерфейса

  VarS.ShowModal;

  try

//инициализируем ТAPI (интерфейс, устройства)

    TAPILineService1.Active:=True;

    TAPILine1.Active:=True;

    TAPIAddress1.SetStatusMessages;

    TAPIPhone1.Device.ID:= TAPILine1.Device.ID;

    TAPIPhoneService1.Active:=true;

    TAPIPhone1.Active:=true;

   except

      errormsg('Ошибка определения устройства типа модем');

      Application.Terminate;

   end;

//при выборе интерфейса - пользователь

  if VarS.Tag=1 then begin

//установка заголовка формы и ее вида

    SysWaves.Caption:='SysWave - пользователь';

    TabSheet2.TabVisible:=false;

    TabSheet3.TabVisible:=false;

//вывод на экран формата сжатия

    FormatTagLabel.Caption  := FFormatTag;

    FormatDescLabel.Caption := FFormatDesc;

    DisplayMemo.Clear;

    LengthPosLabel.Caption  := '0';

    LengthDispLabel.Caption := '0';

    DevName.Caption:=TAPILineDevice1.Caps.Name;//вывод на экран устройства типа модем

//загрузка настроек из config.ini

    try

      ConfigFile:=TIniFile.Create(IncludeTrailingBackslash(ExtractFilePath(Application.ExeName))+'config.ini');

//загрузка настроек устройства типа модем

        FAutoAnswer:=ConfigFile.ReadBool('DeviceMode','AutoAnswer',true);

        FPulse:=ConfigFile.ReadBool('DeviceMode','Pulse',true);

        TAPIAddress1.NumRings:=ConfigFile.ReadInteger('DeviceMode','NumRings',0);

        FTimeReg:=ConfigFile.ReadInteger('DeviceMode','TimeReg',0);

        VG[1]:=ConfigFile.ReadInteger('VolGain','HeadSetVolume',50000);

        VG[2]:=ConfigFile.ReadInteger('VolGain','HeadSetGain',50000);

        VG[3]:=ConfigFile.ReadInteger('VolGain','HandSetVolume',50000);

        VG[4]:=ConfigFile.ReadInteger('VolGain','HandSetGain',50000);

      ConfigFile.Free;

    except

      errormsg('Ошибка загрузки конфигурации!');

      Application.Terminate;

    end;

    if FAutoAnswer then Label4.Caption:='Авто'

    else Label4.Caption:='Ручной'

  end;

//при выборе интерфейса - администратор

  if VarS.Tag=2 then begin

//установка заголовка формы и ее вида

    SysWaves.Caption:='SysWave - администратор';

    TabSheet1.TabVisible:=false;

    ModemName.Caption:=TAPILineDevice1.Caps.Name;

//вывод на экран формата сжатия

    GetFormatTag.Caption  := FFormatTag;

    GetFormatDesc.Caption := FFormatDesc;

    TAPILineService1.Active:=false;

    TAPILine1.Active:=false;

    TAPIPhoneService1.Active:=false;

    TAPIPhone1.Active:=false;

//загрузка настроек из config.ini

    try

      ConfigFile:=TIniFile.Create(IncludeTrailingBackslash(ExtractFilePath(Application.ExeName))+'config.ini');

        RadioButton1.Checked:=ConfigFile.ReadBool('DeviceMode','AutoAnswer',true);

        RadioButton2.Checked:= not RadioButton1.Checked;

        CheckBox1.Checked:=ConfigFile.ReadBool('DeviceMode','Pulse',true);

        MaskEdit1.Text:=ConfigFile.ReadString('DeviceMode','NumRings','0');

        MaskEdit2.Text:=ConfigFile.ReadString('DeviceMode','TimeReg','0');

        HeadSetVolUpDown.Position:=trunc(ConfigFile.ReadInteger('VolGain','HeadSetVolume',0)/2);

        HeadSetGainUpDown.Position:=trunc(ConfigFile.ReadInteger('VolGain','HeadSetGain',0)/2);

        HandSetVolUpDown.Position:=trunc(ConfigFile.ReadInteger('VolGain','HandSetVolume',0)/2);

        HandSetGainUpDown.Position:=trunc(ConfigFile.ReadInteger('VolGain','HandSetGain',0)/2);

      ConfigFile.Free;

    except

      errormsg('Ошибка загрузки конфигурации!');

      Application.Terminate;

    end;

  end;

//открытие базы данных 

  Datamodule1.WavBase.Open;

  if not Datamodule1.WavBase.Active then begin

    errormsg('Ошибка открытия базы данных!');

    Application.Terminate;

  end;

end;

////////////////////////////////////////////////////////////////////////////

//при закрытии формы и всей проги

procedure TSysWaves.FormDestroy(Sender: TObject);

begin

//отключаем ТAPI (интерфейс, устройства)

  TAPIPhoneService1.Active:=false;

  TAPILineService1.Active:=false;

  TAPILine1.Active:=false;

  TAPIPhone1.Active:=false;

//если идет запись остановить ее

  if FRecorderMode = recModeRecord then StopWaveRecord

//если идет проигрыш остановить его

  else if FRecorderMode = recModePlay then StopWavePlay;

// Освобождение памяти, связанной с wav буферами. 

  DestroyWaveRecorder;

end;

//////////////////////////////////////////////////////////////////////////

//Вывод информациии о программе

procedure TSysWaves.About1Click(Sender: TObject);

begin

  Abouts.ShowModal;

end;

////////////////////////////////////////////////////////////////////////////

//при нажатии Выход

procedure TSysWaves.exit1Click(Sender: TObject);

begin

   close;

end;

{********************работа с модемом***************************************}

//при удаление устройства из системы

procedure TSysWaves.TAPILineDevice1StateReMoved(Sender: TObject);

begin

   errormsg('Устройство было удалено из системы. Программа будет закрыта');

   Application.Terminate;

end;

/////////////////////////////////////////////////////////////////////////////

//набор номера(запрос на соединение)

procedure TSysWaves.DialNoClick(Sender: TObject);

begin

  DialNo.Enabled:=false;

  CancelNo.Enabled:=true;

//проверка настройки тонального или импульсного набора номера 

  if FPulse then TAPIAddress1.OutboundCall.MakeCall(TAPILine1.Handle,'p'+ CallNo.Text,0)

  else TAPIAddress1.OutboundCall.MakeCall(TAPILine1.Handle,'t'+ CallNo.Text,0)

end;

////////////////////////////////////////////////////////////////////////////

//отмена набора номера и соединения

procedure TSysWaves.CancelNoClick(Sender: TObject);

begin

  Display('Идет отмена вызова...');

  TAPICall1.Drop;//понижение статуса вызова

  DialNo.Enabled:=true;

  CancelNo.Enabled:=false

end;

/////////////////////////////////////////////////////////////////////////////

//при состоянии соединения модема с удаленным телефоном

procedure TSysWaves.TAPICall1StateConnected(Sender: TObject;

  ConnectedMode: TLineConnectedModes; Rights: TLineCallPrivilege);

begin

  Display('Соединение...');

  TAPIPhone1.SpeakerHookSwitchMode:=phsmMicSpeaker;//включаем общую связь

  TAPIPhone1.SpeakerVolume:=65000;

  TAPIPhone1.SpeakerGain:=65000;

  TAPIPhone1.HeadSetHookSwitchMode:=phsmMicSpeaker;//включаем наушники

  TAPIPhone1.HandSetHookSwitchMode:=phsmMicSpeaker;//включаем микрофон

//установка громкости наушников и микрофона

  TAPIPhone1.HeadSetVolume:=VG[1];

  TAPIPhone1.HeadSetGain:=VG[2];

  TAPIPhone1.HandSetGain:=VG[3];

  TAPIPhone1.HandSetVolume:=VG[4];

//если идет запись

 if FRecorderMode <> recModeOff then  // остановить запись

    StopWaveRecord

  else    begin

    Display('Идет запись...');

//делаем записи в базе данных

    Datamodule1.WavBase.Insert;

    Datamodule1.WavBase.FieldByName('DateName').AsDateTime:=Date;//дата

    Datamodule1.WavBase.FieldByName('TimeName').AsDateTime:=Time;//время

    //имя пользователя

    Datamodule1.WavBase.FieldByName('UserName').AsString:=VarS.UserName.Text;

    FTimeCounter:=0;//обнуляем счетчик времени

    StartWaveRecord; // начать запись

  end;

end;

/////////////////////////////////////////////////////////////////////////////

//при состоянии разъединения модема с удаленным телефоном

procedure TSysWaves.TAPICall1StateDisconnected(Sender: TObject;

  DisconnectedMode: TLineDisconnectMode; Rights: TLineCallPrivilege);

begin

  Display('Соединение разорвано');

  //если идет запись

  if FRecorderMode <> recModeOff then  //остановить запись

        StopWaveRecord;

//если время разговора >= времени регистрации

  if  FTimeCounter >= FTimeReg  then begin

    SaveWaveFile;//сохранить файл с звуковыми данными

    Datamodule1.WavBase.Post;//запись внесенных изменений в базу данных

  end

  else

    Datamodule1.WavBase.Cancel;//отмена изменений внесенных в текущую запись

  Answer.Enabled:=true;

  HandsetDown.Enabled:=false;

  TAPICall1.Drop;//понижение статуса запроса

end;

/////////////////////////////////////////////////////////////////////////////

//сообщение о наборе номера

procedure TSysWaves.TAPICall1StateProceeding(Sender: TObject;

  Rights: TLineCallPrivilege);

begin

   display('Идет набор номера ' + CallNo.Text);

end;

///////////////////////////////////////////////////////////////////////////////

//при состоянии звонка

procedure TSysWaves.TAPILineDevice1StateRinging(Sender: TObject;

  RingModeIndex, RingCounter: Cardinal);

begin

  display('Звонок...');

  Windows.Beep(300, 500);//подача звукового сигнала через встроенный динамик

  Windows.Beep(350, 500);

//если режим ответа модема - авто

  if FAutoAnswer then begin

//если кол-во принятых звонков >= заданных

    if RingCounter >= TAPIAddress1.NumRings then begin

      Answer.Enabled:=false;

      HandsetDown.Enabled:=true;

      TAPIAddress1.InboundCall.Answer;//модем берет трубку

    end;

  end

end;

/////////////////////////////////////////////////////////////////////////

//при поступлении информации о входящем звонке

procedure TSysWaves.TAPICall1InfoCallerId(Sender: TObject);

begin

//если есть информация о входящем звонке

  if TAPICall1.Info.CallerID <> '' then  begin

    display('Входящий звонок с номером' + TAPICall1.Info.CallerID);

  end;

end;

////////////////////////////////////////////////////////////////////////////

//пользователь берет трубку

procedure TSysWaves.AnswerClick(Sender: TObject);

begin

  Answer.Enabled:=false;

  HandsetDown.Enabled:=true;

  TAPIAddress1.InboundCall.Answer;//модем берет трубку

end;

////////////////////////////////////////////////////////////////////////////

//пользователь положил трубку

procedure TSysWaves.HandsetDownClick(Sender: TObject);

begin

  Answer.Enabled:=true;

  HandsetDown.Enabled:=false;

  TAPICall1.Drop;//понижение статуса запроса

end;

////////////////////////////////////////////////////////////////////////////////

//отчистка набираемого номера

procedure TSysWaves.ClearNoClick(Sender: TObject);

begin

  CallNo.Clear;

end;

//при состоянии поступления предложения запроса

procedure TSysWaves.TAPICall1StateOffering(Sender: TObject;

  OfferingMode: TLineOfferingModes; Rights: TLineCallPrivilege);

begin

  TAPIAddress1.InboundCall.Accept;// приложение примет контроль вызова

end;

//если запрос находится в неактивном состоянии

procedure TSysWaves.TAPICall1StateIdle(Sender: TObject;

  Rights: TLineCallPrivilege);

begin

  TAPICall1.DeallocateCall;

end;

//при состоянии занято

procedure TSysWaves.TAPICall1StateBusy(Sender: TObject;

  BusyMode: TLineBusyMode; Rights: TLineCallPrivilege);

begin

  TAPIAddress1.OutboundCall.Drop;

end;

//ответ модема

procedure TSysWaves.TAPICall1Reply(Sender: TObject; AsyncFunc: TAsyncFunc;

  Error: Cardinal);

begin

   if Error <> 0 then errormsg('Ошибка.Модем не может реагировать на запрос.');

   if AsyncFunc =afDrop then TAPICall1.DeallocateCall;

end;

{***********************набор номера с клавиатура на экране******************************************}

procedure TSysWaves.SpeedButton1Click(Sender: TObject);

begin

  CallNo.Text:=CallNo.Text + '1';

end;

procedure TSysWaves.SpeedButton2Click(Sender: TObject);

begin

  CallNo.Text:=CallNo.Text + '2';

end;

procedure TSysWaves.SpeedButton3Click(Sender: TObject);

begin

  CallNo.Text:=CallNo.Text + '3';

end;

procedure TSysWaves.SpeedButton4Click(Sender: TObject);

begin

  CallNo.Text:=CallNo.Text + '4';

end;

procedure TSysWaves.SpeedButton5Click(Sender: TObject);

begin

  CallNo.Text:=CallNo.Text + '5';

end;

procedure TSysWaves.SpeedButton6Click(Sender: TObject);

begin

   CallNo.Text:=CallNo.Text + '6';

end;

procedure TSysWaves.SpeedButton7Click(Sender: TObject);

begin

  CallNo.Text:=CallNo.Text + '7';

end;

procedure TSysWaves.SpeedButton8Click(Sender: TObject);

begin

  CallNo.Text:=CallNo.Text + '8';

end;

procedure TSysWaves.SpeedButton9Click(Sender: TObject);

begin

  CallNo.Text:=CallNo.Text + '9';

end;

procedure TSysWaves.SpeedButton10Click(Sender: TObject);

begin

  CallNo.Text:=CallNo.Text + '0';

end;

procedure TSysWaves.SpeedButton11Click(Sender: TObject);

begin

  CallNo.Text:=CallNo.Text + '*';

end;

procedure TSysWaves.SpeedButton12Click(Sender: TObject);

begin

  CallNo.Text:=CallNo.Text + '#';

end;

{******************Работа со звуком****************************************}

//=========================инициализация===================================

//Размещение формата и заголовков wav, буфера данных, и получение временного имени файла

function TSysWaves.InitWaveRecorder : integer;

var

    Temp : array [0..MAX_PATH] of char;

begin

  Result := -1;

// размещение в памяти  структуры формата wav...

  if AllocWaveFormatEx <> 0 then

    Exit;

// размещение в памяти заголовка wav...

  if AllocWaveHeader <> 0 then begin

    Result := -3;

    Exit;

  end;

// размещение в памяти буфера данных wav

  if AllocPCMBuffers <> 0 then begin

    Result := -4;

    Exit;

  end;

//Генирируем имя временного файла

  GetTempPath(sizeof(Temp), Temp);

  SetLength(FTmpFileName, MAX_PATH);

  GetTempFileName(Temp, 'wr', 0, PChar(FTmpFileName));

  Result := 0;

end;

////////////////////////////////////////////////////////////////////////////

//Размещение и захват структуры WAVEFORMATEX, основанной на максимальном размере

//формата согласно ACM.

function TSysWaves.AllocWaveFormatEx : Integer;

var

v:variant;

begin

//если не получен наибольший размер формата, требуемый от установленного ACM...

  if acmMetrics(nil, ACM_METRIC_MAX_SIZE_FORMAT, FMaxFmtSize) <> 0 then begin

    errormsg('Ошибка получения размера максимального формата сжатия .');

    Result := -1;

    Exit;

  end;

//выделение памяти

  GetMem(FWaveFormat, FMaxFmtSize);

//если формат неопределен

  if FWaveFormat = nil then begin

    errormsg('Ошибка размещения в памяти WaveFormatEx структуры.');

    Result := -2;

    Exit;

  end;

//обнуление структуры FWaveFormat

  FillChar(FWaveFormat^, FMaxFmtSize, 0);

//загрузка настроек звукового формата из config.ini

  try

    ConfigFile:=TIniFile.Create(IncludeTrailingBackslash(ExtractFilePath(Application.ExeName))+'config.ini');

      FWaveFormat.wFormatTag:=ConfigFile.ReadInteger('WaveFormat','FormatTag',WAVE_FORMAT_PCM);

      FWaveFormat.nChannels:=ConfigFile.ReadInteger('WaveFormat','Channels',1);

      v:=ConfigFile.ReadInteger('WaveFormat','SamplesPerSec',8000);

      FWaveFormat.nSamplesPerSec:=v;

      v:=ConfigFile.ReadInteger('WaveFormat','AvgBytesPerSec',8000);

      FWaveFormat.nAvgBytesPerSec:=v;

      FWaveFormat.nBlockAlign:=ConfigFile.ReadInteger('WaveFormat','BlockAlign',1 );

      FWaveFormat.wBitsPerSample:=ConfigFile.ReadInteger('WaveFormat','BitsPerSample',16);

      FWaveFormat.cbSize:=ConfigFile.ReadInteger('WaveFormat','Size',0);

    ConfigFile.Free;

  except

    errormsg('Ошибка загрузки конфигурации!');

    Application.Terminate;

  end;

// сохранить формат и теги строки описания

  GetFormatTagDetails(FWaveFormat.wFormatTag);

  GetFormatDetails(FWaveFormat);

  Result := 0;

end;

////////////////////////////////////////////////////////////////////////////

// Получение подробности формата, и сохранение строкового описания.

function TSysWaves.GetFormatDetails(pfmtin : PWAVEFORMATEX) : integer;

var

    acmfmtdetails : TACMFORMATDETAILS;

begin

//обнуление структуру acmfmtdetails

  FillChar(acmfmtdetails, sizeof(acmfmtdetails), 0);

  acmfmtdetails.cbStruct    := sizeof(acmfmtdetails);

  acmfmtdetails.pwfx        := pfmtin;

  acmfmtdetails.dwFormatTag := pfmtin.wFormatTag;

  acmfmtdetails.cbwfx       := sizeof(TWAVEFORMATEX) + pfmtin.cbSize;

//если запрос о сведении формата <> 0 то  FormatDetails функция потерпела неудачу

  if acmFormatDetails(nil, acmfmtdetails, ACM_FORMATDETAILSF_FORMAT) <> 0 then begin

    errormsg('Ошибка, FormatDetails не работает');

    Result := -1;

    Exit;

  end;

// сохранение строки описания деталей формата...

  FFormatDesc := acmfmtdetails.szFormat;

  Result := 0;

end;

////////////////////////////////////////////////////////////////////////////

// размещение в памяти заголовка wave

function TSysWaves.AllocWaveHeader : integer;

var

  i : Integer;

begin

  for i := Low(FWaveHdr) to High(FWaveHdr) do begin

    GetMem(FWaveHdr[i], sizeof(TWAVEHDR));//выделяем память под заголовок

//если заголовок не определен

    if FWaveHdr[i] = nil then begin

      errormsg('Ошибка размещения в памяти заголовка wave.');

      Result := -1;

      Exit;

    end;

  end;

  Result := 0;

end;

/////////////////////////////////////////////////////////////////////////////

//размещение wave буфера в памяти

function TSysWaves.AllocPCMBuffers : Integer;

var

    i : Integer;

begin

  for i := Low(FWaveMem) to High(FWaveMem) do begin

    GetMem(FWaveMem[i], WAVE_BUFSIZE);//выделяем память под wav буфер

//если wav буфер не определен

    if FWaveMem[i] = nil then begin

      errormsg('Ошибка размещения wave буфера в памяти.');

      Result := -1;

      Exit;

    end;

    FWaveHdr[i].lpData := FWaveMem[i];

  end;

  Result := 0;

end;

/////////////////////////////////////////////////////////////////////////////

//========================завершение============================================

 

//Освобождение памяти, связанной с буферами wav

procedure TSysWaves.DestroyWaveRecorder;

begin

  FreeWaveFormatEx;// Освобождение памяти от структуры WAVEFORMATEX

  FreePCMBuffers;//Освобождение памяти от wav буферов.

  FreeWaveHeader;//Освобождение памяти заголовка wav.

  DeleteTmpFile;//Удаление временного файла

end;

////////////////////////////////////////////////////////////////////////////

//Освобождение памяти от структуры WAVEFORMATEX

procedure TSysWaves.FreeWaveFormatEx;

begin

//если FWaveFormat не является неопределенной

  if FWaveFormat <> nil then begin

    FreeMem(FWaveFormat);

    FWaveFormat := nil;

  end;

end;

////////////////////////////////////////////////////////////////////////////

//Освобождение памяти wav буферов.

procedure TSysWaves.FreePCMBuffers;

var

  i : Integer;

begin

  for i := Low(FWaveMem) to High(FWaveMem) do begin

    if FWaveMem[i] <> nil then begin

      FreeMem(FWaveMem[i]);

      FWaveMem[i] := nil;

    end;

  end;

end;

/////////////////////////////////////////////////////////////////////////////

//Освобождение памяти заголовка wav.

procedure TSysWaves.FreeWaveHeader;

var

  i : Integer;

begin

  for i := Low(FWaveHdr) to High(FWaveHdr) do begin

    if FWaveHdr[i] <> nil then begin

      FreeMem(FWaveHdr[i]);

      FWaveHdr[i] := nil;

    end;

  end;

end;

//==============работа с временым файлом========================================

//Создание временного файла чтобы писать wav данные.

function TSysWaves.CreateTmpFile : integer;

var

  RootPathName          : array [0..MAX_PATH] of char;

  SectorsPerCluster     : DWORD;

  BytesPerSector        : DWORD;

  NumberOfFreeClusters  : DWORD;

  TotalNumberOfClusters : DWORD;

begin

  FTmpFileHandle := _lcreat(PChar(FTmpFileName), 0);//получение дескриптора

                                              //временного файла и его создание

//если произошла ошибка создания временого файла

  if FTmpFileHandle = HFILE_ERROR then begin

    errormsg('Ошибка создания временого файла');

    Result := -1;

    Exit;

  end;

// получение доступного пространства на временном диске...

//если в полном имени файла есть знак ':'

  if FTmpFileName[2] = ':' then

//то имя диска определяется так

    RootPathName[0] := FTmpFileName[1]

  else //иначе

//получение текущей дериктории

    GetCurrentDirectory(sizeof(RootPathName), @RootPathName);

  RootPathName[1] := ':';

  RootPathName[2] := '\';

  RootPathName[3] := #0;

//получение свободного места на диске

  GetDiskFreeSpace(@RootPathName,

                   SectorsPerCluster,

                   BytesPerSector,

                   NumberOfFreeClusters,

                   TotalNumberOfClusters);

//FDiskFreeSpace = кол-во Свободных Кластеров * секторов в кластере

  FDiskFreeSpace := NumberOfFreeClusters * SectorsPerCluster;

// FDiskFreeSpace = кол-во Свободных секторов * байт в секторе

  FDiskFreeSpace := FDiskFreeSpace * BytesPerSector;

  Result := 0;

end;

////////////////////////////////////////////////////////////////////////////

// Закройте временный файл содержащий недавно записаные данные.

procedure TSysWaves.CloseTmpFile;

begin

  if _lclose(FTmpFileHandle) = HFILE_ERROR then

    errormsg('Ошибка закрытия временного файла');

end;

//////////////////////////////////////////////////////////////////////////////

// Удалите временный файл

procedure TSysWaves.DeleteTmpFile;

begin

//если длина временного файла > 0

  if Length(FTmpFileName) > 0 then

    DeleteFile(FTmpFileName);//удалить файл

end;

////////////////////////////////////////////////////////////////////////////

 // Откройте временный файл для чтения.

function TSysWaves.OpenTmpFile : Integer;

begin

// Открываем временный файл для чтения.

  FTmpFileHandle := _lopen(PChar(FTmpFileName), OF_READ);

//если произошла ошибка открытия временного файла

  if FTmpFileHandle = HFILE_ERROR then

    Result := 0

  else

    Result := 1;

end;

//==================работа с записью============================================

// Остановка записи

procedure TSysWaves.StopWaveRecord;

var

  v:variant;

begin

  FRecorderMode := recModeOff;//устанавливаем режим рекордера - выключен

//Функция waveInReset останавливает операцию загрузки данных.

//Все текущие буферы отмечаются как обработанные и приложение уведомляется

//о завершении загрузки данных

  if waveInReset(FWaveIn) <> 0 then

    errormsg('Ошибка остановки записи');

  CloseWaveDeviceRecord;//закрытие устройства записи

  Timer3.Enabled := FALSE;// стоп таймер

end;

////////////////////////////////////////////////////////////////////////////

// Подготовка заголовков, добавление буфера, подготовка показа, и начало записи.

function TSysWaves.StartWaveRecord : Integer;

var

  Status : MMRESULT;

  Flags:DWord;

  WaveInCaps:PWaveInCaps;

begin

//обнуляем номер записанных выборок, размер записаных данных и номер буфера

  FTotalWaveSize := 0;

  FByteDataSize  := 0;

  FBufIndex      := 0;

//получаем номер открываемого устройства типа модем

  FWaveInID :=TAPICall1.GetWaveID('wave/in');

//если номер открываемого устройства равен полученному автоматически то

  if FWaveInID= Wave_Mapper then

    Flags:=WAVE_FORMAT_QUERY//устанавливаем флаг , чтобы  функция запрашивала

//устройство для определения, поддерживает ли оно указанный формат, но не открывала его;

  else

    Flags:=WAVE_FORMAT_QUERY or WAVE_MAPPED;

  Status := waveInOpen(@FWaveIn, FWaveInID, FWaveFormat,

                         0, 0, Flags);

  if Status <> MMSYSERR_NOERROR then begin

    errormsg('Ошибка открытия устройства ввода данных для записи.');

    Result := -1;

    Exit;

  end;

  if FWaveInID = Wave_Mapper then Flags:=CALLBACK_WINDOW

  else

     Flags:=CALLBACK_WINDOW or WAVE_MAPPED;

  Status := waveInOpen(@FWaveIn, FWaveInID, FWaveFormat,

                         HWND(SysWaves.Handle), 0, Flags);

  if Status <> MMSYSERR_NOERROR then begin

    errormsg(' Ошибка открытия устройства ввода данных для записи.');

    Result := -1;

    Exit;

  end;

//устанавливаем признак открытия устройства

  FDeviceOpened := TRUE;

// Обнуляем заголовки wav и инициализируем указатели данных и буферные длины

  InitWaveHeaders;

//если подготовка буферов для операции загрузки данных не успешна

  if not ((waveInPrepareHeader(FWaveIn, FWaveHdr[0], sizeof(TWAVEHDR)) = 0) and

        (waveInPrepareHeader(FWaveIn, FWaveHdr[1], sizeof(TWAVEHDR)) = 0))

  then begin

    CloseWaveDeviceRecord;//закрыть устройство

    errormsg('Ошибка подготовки заголовка для записи.');

    Result := -2;

    Exit;

  end;

// добавляем первый буфер...

  if AddNextBuffer <> 0 then begin

    Result := -3;

    Exit;

  end;

//Создаем временный файл, в который мы будем писать...

  if CreateTmpFile <> 0 then begin

    CloseWaveDeviceRecord;//закрыть устройство

    Result := -4;

    Exit;

  end;

// запускаем начало записи

  if waveInStart(FWaveIn) <> 0 then begin

    CloseWaveDeviceRecord;//закрыть устройство

    errormsg('Ошибка начала записи.');

    Result := -5;

    Exit;

  end;

  FRecorderMode := recModeRecord;//режим рекордера - запись

// установка таймера чтобы модифицировать дисплей...

  Timer3.Interval := 1000;

  Timer3.Enabled  := TRUE;

  UpdateLength(0, FDiskFreeSpace);

//добавляем в очередь следующий буфер...

  if AddNextBuffer <> 0 then begin

    Result := -6;

    Exit;

  end;

  Result := 0;

end;

////////////////////////////////////////////////////////////////////////////////

// Обнуляем заголовки wav и инициализируем указатели данных и буферные длины

procedure TSysWaves.InitWaveHeaders;

begin

  // делаем размер буфера , который выравнивает множитель блока ...

  FWaveBufSize := (WAVE_BUFSIZE - WAVE_BUFSIZE mod FWaveFormat.nBlockAlign);

  // обнулить заголовки wav

  FillChar(FWaveHdr[0]^, sizeof(TWAVEHDR), 0);

  FillChar(FWaveHdr[1]^, sizeof(TWAVEHDR), 0);

  // теперь инициализируем указатели данных и буферные длины...

  FWaveHdr[0].dwBufferLength := FWaveBufSize;

  FWaveHdr[1].dwBufferLength := FWaveBufSize;

  FWaveHdr[0].lpData         := FWaveMem[0];

  FWaveHdr[1].lpData         := FWaveMem[1];

end;

///////////////////////////////////////////////////////////////////////////////

//Закрытие временного файла  и устройства, делающего запись.

procedure TSysWaves.CloseWaveDeviceRecord;

begin

// если устройство уже закрыто, возвращаться...

  if not FDeviceOpened then  Exit;

//освобождение памяти занимаемой заголовком1...

  if waveInUnprepareHeader(FWaveIn, FWaveHdr[0], sizeof(TWAVEHDR)) <> 0 then

    errormsg('Ошибка в waveInUnprepareHeader (1)');

//освобождение памяти занимаемой заголовком2...

  if waveInUnprepareHeader(FWaveIn, FWaveHdr[1], sizeof(TWAVEHDR)) <> 0 then

    errormsg('Ошибка в waveInUnprepareHeader (2)');

// сохранение зарегистрированого полного размера зап. данных, и обновление дисплея

  FTotalWaveSize := FByteDataSize;

  UpdateLength(FTotalWaveSize, FDiskFreeSpace);

//признак записи данных

  FRecordedData := TRUE;

// закрыть временый файл

  CloseTmpFile;

// закрыть wav устройство

  if waveInClose(FWaveIn) <> 0 then errormsg('Ошибка закрытия устройства входа');

//признак открытия устройства

  FDeviceOpened := FALSE;

// обновление дисплея

  Display('Запись остановлена');

end;

//////////////////////////////////////////////////////////////////////////////

//Обновление на экране числа записанных байт

procedure TSysWaves.UpdateLength(BytePosition : DWORD; BytePositiontotal : DWORD);

var

v:variant;

begin

  LengthPosLabel.Caption  := IntToStr(BytePosition);//число байт

  LengthDispLabel.Caption := IntToStr(BytePositiontotal);//позиция

end;

//////////////////////////////////////////////////////////////////////////////

// Добавление буфера к очереди и переключение индекса буфера

function TSysWaves.AddNextBuffer : integer;

begin

//ставит в очередь на загрузку данными буфер памяти

  if waveInAddBuffer(FWaveIn, FWaveHdr[FBufIndex], sizeof(TWAVEHDR)) <> 0 then begin

    StopWaveRecord;

    errormsg('Ошибка добавления буфера.');

    Result := -1;

    Exit;

  end;

// переключение индекса для следующего буфера...

  FBufIndex := 1 - FBufIndex;

  Result := 0;

end;

///////////////////////////////////////////////////////////////////////////

//обновления количества записанных байтов

procedure TSysWaves.UpdateRecordDisplay;

var

    mmtime : TMMTIME;

begin

    mmtime.wType := TIME_BYTES;

//Функция восстанавливает текущее положение{позицию} данного звукового  устройства

    waveInGetPosition(FWaveIn, @mmtime, sizeof(mmtime));

    UpdateLength(mmtime.cb, FDiskFreeSpace);//Обновление на экране числа записанных байт

    FTotalWaveSize:=mmtime.cb;//накапливает максимальный размер

end;

//================сохранение файла==============================================

// Сохранение wav файла

function TSysWaves.SaveWaveFile : Integer;

var

  mmfp           : HMMIO;

  dwTotalSamples : DWORD;

  fTotalSamples  : double;

  mminfopar      : TMMCKINFO;

  mminfosub      : TMMCKINFO;

  GetDT          : TSystemTime;

  str            : string;

begin

// если никакие данные не зарегистрированы ,то выход

  if FTotalWaveSize = 0 then begin

    errormsg('Не записаны звуковые данные чтобы сохранить их.');

    Result := 0;

    Exit;

  end;

//получение имени файла

  DateTimeToSystemTime(Now,GetDT);

  with GetDT do  begin

    Datamodule1.WavBase.FieldByName('FileName').AsString:=IntToStr(Integer(wYear))+

    IntToStr(Integer(wMonth))+IntToStr(Integer(wDay))+IntToStr(Integer(wHour))+

    IntToStr(Integer(wMinute))+IntToStr(Integer(wSecond))+'.wav';

    FFilename:=IncludeTrailingBackslash(ExtractFilePath(Application.ExeName))+

            'WavBase\'+ Datamodule1.WavBase.FieldByName('FileName').AsString;

  end;

// откройте wav файл для записи...

  mmfp := mmioOpen(PChar(FFilename), nil,

                     MMIO_CREATE or MMIO_WRITE or MMIO_ALLOCBUF);

//если произошла ошибка открытия файла, то

  if mmfp = 0 then begin

    errormsg('Ошибка открытия файла для записи.');

    Result := -1;

    Exit;

  end;

  Cursor := crHourGlass;

// создайте wav кусок RIFF

  mminfopar.fccType := FOURCC_WAVE;

  mminfopar.cksize := 0;//пусть функция определит размер

//если создание куска неудачно

  if mmioCreateChunk(mmfp, @mminfopar, MMIO_CREATERIFF) <> 0 then begin

    WFerror(mmfp, 'Ошибка создания RIFF wave куска.');

    Result := -2;

    Exit;

  end;

//создайте кусок формата, и запишите wav формат...

  mminfosub.ckid   := FOURCC_FMT;

  mminfosub.cksize := FMaxFmtSize;

//если создание куска неудачно

  if mmioCreateChunk(mmfp, @mminfosub, 0) <> 0 then begin

    WFerror(mmfp, 'Ошибка создания RIFF формата куска.');

    Result := -3;

    Exit;

  end;

//если ошибка записи RIFF

  if mmioWrite(mmfp, PChar(FWaveFormat), FMaxFmtSize) <> LongInt(FMaxFmtSize) then begin

    WFerror(mmfp, 'Ошибка записи RIFF формата данных.');

    Result := -3;

    Exit;

  end;

// назад из куска формата...

  mmioAscend(mmfp, @mminfosub, 0);

// этот кусок только содержит полную длину в выборках...

  mminfosub.ckid   := FOURCC_FACT;

  mminfosub.cksize := sizeof(DWORD);

//если создание куска неудачно

  if mmioCreateChunk(mmfp, @mminfosub, 0) <> 0 then begin

    WFerror(mmfp, 'Ошибка создания RIFF ''фактического'' куска.');

    Result := -4;

    Exit;

  end;

  fTotalSamples := FTotalWaveSize / FWaveFormat.nAvgBytesPerSec *

                     FWaveFormat.nSamplesPerSec;

  dwTotalSamples := Trunc(fTotalSamples);

//если ошибка записи RIFF

  if mmioWrite(mmfp, PChar(@dwTotalSamples), sizeof(dwTotalSamples))

             <> sizeof(dwTotalSamples) then begin

    WFerror(mmfp, 'Ошибка записи RIFF ''фактических'' данных.');

    Result := -4;

    Exit;

  end;

// назад из куска факта...

  mmioAscend(mmfp, @mminfosub, 0);

// теперь создайте, и запишите wav кусок данных...

  mminfosub.ckid   := FOURCC_DATA;

  mminfosub.cksize := 0;// пусть функция определяет размер

//если создание куска неудачно

  if mmioCreateChunk(mmfp, @mminfosub, 0) <> 0 then begin

    WFerror(mmfp, 'Ошибка создания RIFF куска данных.');

    Result := -5;

    Exit;

  end;

// копируйте данные из временного файла в wav файл

  if CopyDataToWaveFile(mmfp) <> 0 then begin

    WFerror(mmfp, 'Ошибка записи wave данных.');

    Result := -5;

    Exit;

  end;

  mmioAscend(mmfp, @mminfosub, 0);

// поднимитесь из куска RIFF...

  mmioAscend(mmfp, @mminfopar, 0);

//закрыть

  mmioClose(mmfp, 0);

  Cursor := crDefault;

  Result := 0;

end;

/////////////////////////////////////////////////////////////////////////////

// Закрытие wav файла, вывод сообщения об ошибках

procedure TSysWaves.WFerror(

    mmfp      : HMMIO;

    const msg : String);

begin

    mmioClose(mmfp, 0);

    Cursor := crDefault;

    errormsg(msg);

end;

///////////////////////////////////////////////////////////////////////////

// Копирование wav данных  из временного файла в wav файл

function TSysWaves.CopyDataToWaveFile(mmfp : HMMIO) : integer;

var

    pbuf   : PChar;

    ht     : HFILE;

    nbytes : integer;

begin

  pbuf := FWaveMem[0]; //используйте один из волновых буферов для копирования

// откройте временный файл для чтения

  ht := _lopen(PChar(FTmpFileName), OF_READ);

//если произошла ошибка открытия файла

  if ht = HFILE_ERROR then begin

    Result := -1;

    Exit;

  end;

// копируйте в RIFF/wave файл

  while TRUE do begin

    nbytes := _lread(ht, pbuf, WAVE_BUFSIZE);

    if nbytes <= 0 then break;

    mmioWrite(mmfp, pbuf, nbytes);

  end;

// закройте файл чтения

  _lclose(ht);

  Result := 0;

end;

//======================получение и установка кодеков=====================================

//функция вызывающая визуальный выбор кодека

function TSysWaves.GetWaveFormat : integer;

var

  acmopt  : TACMFORMATCHOOSE;

  err     : MMRESULT;

  ptmpfmt : PWAVEFORMATEX;

begin

//размещение структуры ptmpfmt в динамич памяти

  GetMem(ptmpfmt, FMaxFmtSize);

//если структура не определена

  if ptmpfmt = nil then begin

    errormsg('Ошибка распределения временного буфера формата.');

    Result := -1;

    Exit;

  end;

//Переместите байты размером FMaxFmtSize из FWaveFormat^ в ptmpfmt^

  Move(FWaveFormat^, ptmpfmt^, FMaxFmtSize);

// ACM установка выбирает поля и отображает диалог...

//заполняет нулями acmopt

  FillChar(acmopt, sizeof(acmopt), 0);

//заносим предварительные данные

  acmopt.cbStruct  := sizeof(acmopt);//размер области памяти, занимаемой структурой.

  acmopt.fdwStyle  := ACMFORMATCHOOSE_STYLEF_INITTOWFXSTRUCT;//флаги стилей

                                                           //построения диалога

  acmopt.hwndOwner := Handle;//ключ окна-владельца создаваемого диалога

  acmopt.pwfx      := FWaveFormat;//указатель области памяти для структуры типа

                                  //WAVEFORMATEX

  acmopt.cbwfx     := FMaxFmtSize;//размер области памяти для структуры описания

                                  //формата

  acmopt.pszTitle  := 'Выбор кодека';

  acmopt.fdwEnum   := ACM_FORMATENUMF_INPUT;//флаги режимов перебора фильтров/форматов.

  err              := acmFormatChoose(acmopt);//выбираем кодек

//сравниваем полученную и предыдущую структуру TWAVEFORMATEX

  if CompareMem(FWaveFormat, ptmpfmt, sizeof(TWAVEFORMATEX)) then

        err := ACMERR_CANCELED; //пользователь закрыл диалог кнопкой Cancel

  if err <> MMSYSERR_NOERROR then begin

//Переместите байты размером FMaxFmtSize из ptmpfmt^ в FWaveFormat^

    Move(ptmpfmt^, FWaveFormat^, FMaxFmtSize);

    FreeMem(ptmpfmt);//освобождаем память

    if err = ACMERR_CANCELED then begin

      Result := 0;

      Exit;

    end;

    errormsg('Ошибка функции FormatChoose');

    Result :=  -2;

    Exit;

  end;

//запомнить описание формата...его характеристики

  FFormatDesc := acmopt.szFormat;

  GetFormatTagDetails(acmopt.pwfx.wFormatTag);

  FreeMem(ptmpfmt);//освобождаем память

  Result := 0;

end;

/////////////////////////////////////////////////////////////////////////////

// Получение подробности тэга формата, и сохранение строкового описания.

function TSysWaves.GetFormatTagDetails(wFormatTag : WORD) : integer;

var

    acmtagdetails : TACMFORMATTAGDETAILS;

begin

// обнулить....

  FillChar(acmtagdetails, sizeof(acmtagdetails), 0);

  acmtagdetails.cbStruct    := sizeof(acmtagdetails);

  acmtagdetails.dwFormatTag := wFormatTag;

//если запрос о сведении типа формата <> 0 то

  if acmFormatTagDetails(nil, acmtagdetails,

                           ACM_FORMATTAGDETAILSF_FORMATTAG) <> 0 then begin

    errormsg('Ошибка функции FormatTagDetails');

    Result := -1;

    Exit;

  end;

//сохраните строку описания деталей формата...

  FFormatTag := acmtagdetails.szFormatTag;

  Result := 0;

end;

//===================проигрывание звука=========================================

//Чтение волнового файла

function TSysWaves.ReadWaveFile : Integer;

var

    mmfp           : HMMIO;

    mminfopar      : TMMCKINFO;

    mminfosub      : TMMCKINFO;

    dwTotalSamples : DWORD;

    Sec,Min:variant;

begin

  dwTotalSamples:=0;

//получаем имя проигрываемого файла

  FFileName:= IncludeTrailingBackslash(ExtractFilePath(Application.ExeName)) +

  'WavBase\'+ datamodule1.WavBase.FieldByName('FileName').AsString;

// открыть wave файл для чтения...

  mmfp := mmioOpen(PChar(FFileName), nil, MMIO_READ + MMIO_ALLOCBUF);

//если файл не открыт

  if mmfp = 0 then begin

    errormsg('Ошибка открытия файла для чтения.');

    Result := -1;

    Exit;

  end;

  Cursor := crHourGlass;

// поиск  куска формата...

  mminfopar.fccType := FOURCC_WAVE;

  if mmioDescend(mmfp, @mminfopar, nil, MMIO_FINDRIFF) <> 0 then begin

    WFerror(mmfp, 'Wave формат не найден в файле.');

    Result := -2;

    Exit;

  end;

  mminfosub.ckid := FOURCC_FMT;

  if mmioDescend(mmfp, @mminfosub, @mminfopar, MMIO_FINDCHUNK) <> 0 then begin

    WFerror(mmfp, 'Формат куска не найден.');

    Result := -3;

    Exit;

  end;

//если размер wav формата > максимального размера ACM

  if mminfosub.cksize > FMaxFmtSize then begin

    WFerror(mmfp, 'Размер формата в файле не соответствует типам ACM.');

    Result := -4;

    Exit;

  end;

// читайте wav формат....

  if mmioRead(mmfp, PChar(FWaveFormat), mminfosub.cksize)

          <> LongInt(mminfosub.cksize) then begin

    WFerror(mmfp, 'Ошибка чтения куска формата.');

    Result := -4;

    Exit;

  end;

//назад

  mmioAscend(mmfp, @mminfosub, 0);

//поиск 'фактического'' куска

  mminfosub.ckid   := FOURCC_FACT;

  if mmioDescend(mmfp, @mminfosub, @mminfopar, MMIO_FINDCHUNK) <> 0 then begin

    WFerror(mmfp, 'Ошибка поиска RIFF ''фактического'' куска.');

    Result := -7;

    Exit;

  end;

//чтение ''фактических'' данных

  if mmioRead(mmfp, PChar(@dwTotalSamples), mminfosub.cksize)

          <> LongInt(mminfosub.cksize) then begin

    WFerror(mmfp, 'Ошибка чтения RIFF ''фактических'' данных.');

    Result := -7;

    Exit;

  end;

//получение общего времени проигрывания файла

  min:=0;

  Sec:=dwTotalSamples/FWaveFormat.nSamplesPerSec ;

  trackbar1.Max:= trunc(Sec);

  if Sec/60 < 1 then Sec:=trunc(Sec)

  else  begin

    Min:=trunc(Sec/60);

    Sec:=trunc((Sec/60-Min)*60);

  end;

  Label10.Caption:=Format('%.2d:%.2d',[integer(Min),integer(Sec)]);

// назад из куска факта...

  mmioAscend(mmfp, @mminfosub, 0);

// получите полный wav размер данных (mminfo.cksize)..

  mminfosub.ckid := FOURCC_DATA;

  if mmioDescend(mmfp, @mminfosub, @mminfopar, MMIO_FINDCHUNK) <> 0 then begin

    WFerror(mmfp, 'Кусок данных не найден.');

    Result := -5;

    Exit;

  end;

// если нет никаких данных,

  if mminfosub.cksize = 0 then begin

    WFerror(mmfp, 'Кусок данных не содержит никаких данных.');

    Result := -6;

    Exit;

  end;

// теперь читайте wav данные и копируйте во временный файл...

  if CopyWaveToTempFile(mmfp, mminfosub.cksize) <> 0 then begin

    mminfosub.cksize := 0;

    errormsg('Ошибка чтения  wave данных.');

  end;

//закрытие wav файл

  mmioClose(mmfp, 0);

  Cursor := crDefault;

  FTotalWaveSize := mminfosub.cksize;

// признак записи данных

  FRecordedData := FALSE;

// сохраните формат и тег описание строки...

  GetFormatTagDetails(FWaveFormat.wFormatTag);

  GetFormatDetails(FWaveFormat);

  FTLabel.Caption  := FFormatTag;

  FDLabel.Caption := FFormatDesc;

  Result  := 0;

end;

/////////////////////////////////////////////////////////////////////////////

// Копируйте данные волны из файла RIFF в временый файл.

function TSysWaves.CopyWaveToTempFile(mmfp: HMMIO;datasize : DWORD) : Integer;

var

  pbuf     : PChar;

  ntotal   : DWORD;

  nbytes   : integer;

  readsize : DWORD;

begin

  pbuf     := FWaveMem[0];

  readsize := WAVE_BUFSIZE;

  ntotal   := 0;

  Result   := 0;

// создайте временный файл, основанный на текущем временном имени

  if CreateTmpFile <> 0 then begin

    Result := -1;

    Exit;

  end;

//введите чтение/копирование цикл

  while ntotal < datasize do begin

    if (ntotal + readsize) > datasize then readsize := datasize - ntotal;

    nbytes := mmioRead(mmfp, pbuf, readsize);

    if nbytes = 0 then begin

      Result := -2;

      break;

    end;

    if _lwrite(FTmpFileHandle, pbuf, nbytes) <> UINT(nbytes) then begin

      Result := -3;

      break;

    end;

    Inc(ntotal, nbytes);

  end;

// закройте файл чтения...

  CloseTmpFile;

end;

////////////////////////////////////////////////////////////////////////////

//Подготовка заголовков, добавьте буфер, и начните делать запись.

function TSysWaves.StartWavePlay : Integer;

begin

  FByteDataSize := 0;

  FBufIndex     := 0;

// откройте устройство для регистрации(записи)...

  if waveOutOpen(@FWaveOut, WAVE_MAPPER, FWaveFormat,

                   Handle, 0, CALLBACK_WINDOW or WAVE_ALLOWSYNC) <> 0 then begin

    errormsg('Ошибка открытия устройства проигрывания.');

    Result := -1;

    Exit;

  end;

  FDeviceOpened := TRUE;

// подготовка заголовков...

  InitWaveHeaders;

  if (waveOutPrepareHeader(FWaveOut, FWaveHdr[0], sizeof(TWAVEHDR)) <> 0) or

       (waveOutPrepareHeader(FWaveOut, FWaveHdr[1], sizeof(TWAVEHDR)) <> 0)

  then begin

    CloseWaveDevicePlay;

    errormsg('Ошибка подготовки заголовков для проигрывания.');

    Result := -2;

    Exit;

  end;

// откройте временный файл для чтения...

  if OpenTmpFile = 0 then begin

    CloseWaveDevicePlay;

    errormsg('Ошибка открытия временного файла для чтения');

    Result := -3;

    Exit;

  end;

// запишите первый буфер, чтобы запустить играть..

  if QueueNextBuffer <> 0 then begin

    CloseWaveDevicePlay;

    Result := -4;

    Exit;

  end;

  FRecorderMode := recModePlay;

  FMoreToPlay   := TRUE;

// установите таймер чтобы модифицировать дисплей....

  Timer1.Interval := 1000;

  Timer1.Enabled  := TRUE;

// и очередь следующий буфер..

  QueueNextBuffer;

  Result := 0;

end;

////////////////////////////////////////////////////////////////////////////

// закрытие устройства проигрывания

procedure TSysWaves.CloseWaveDevicePlay;

begin

//освобождение памяти заголовков

  if (waveOutUnprepareHeader(FWaveOut, FWaveHdr[0], sizeof(TWAVEHDR)) <> 0) or

       (waveOutUnprepareHeader(FWaveOut, FWaveHdr[1], sizeof(TWAVEHDR)) <> 0)

  then  errormsg('Ошибка работы с заголовками.');

// закрыть устройство

  if waveOutClose(FWaveOut) <> 0 then

        errormsg('Ошибка закрытия устройства для проигрывания.');

  FDeviceOpened := FALSE;

  // закрыть временый файл

  CloseTmpFile;

  Play.Caption:='Играть';

  Select.Enabled:=true;

  NoSelect.Enabled:=true;

  DelTrack.Enabled:=true;

  TrackBar1.Position:=0;

  Play.Enabled:=true;

  Stop.Enabled:=false;

  Label10.Caption :=Format('%.2d:%.2d',[0,0]);

  Label11.Caption :=Format('%.2d:%.2d',[0,0]);

end;

////////////////////////////////////////////////////////////////////////////

// Запись из буфера в устройство проигрывания и переключение индекса буфера .

function TSysWaves.QueueNextBuffer : Integer;

begin

// заполните волновой буфер данными от файла...

  if ReadWaveBuffer = 0 then begin

// сбросьте поля признака (удалите атрибут WHDR_DONE)...

    FWaveHdr[FBufIndex].dwFlags := WHDR_PREPARED;

// теперь очередь буфер для вывода...

    if waveOutWrite(FWaveOut, FWaveHdr[FBufIndex], sizeof(TWAVEHDR)) <> 0

    then begin

      StopWavePlay;

      errormsg('Ошибка записи wave буфера.');

      Result := -1;

      Exit;

    end;

// переключите для следующего буфера...

    FBufIndex := 1 - FBufIndex;

  end;

  Result := 0;

end;

////////////////////////////////////////////////////////////////////////////

// Читайте кусок wav из временного файла

function TSysWaves.ReadWaveBuffer : Integer;

begin

// если мы не столкнулись с концом wav , читайте другой буфер

  if FByteDataSize < FTotalWaveSize then begin

// читайте кусок wav из временного файла

    FWaveHdr[FBufIndex].dwBufferLength :=

                   _lread(FTmpFileHandle, FWaveMem[FBufIndex], FWaveBufSize);

// модифицируйте общее количество байтов чтения

    Inc(FByteDataSize, FWaveHdr[FBufIndex].dwBufferLength);

    Result := 0;

    Exit;

  end;

  FMoreToPlay := FALSE;    // обработанный в MM_WOM_DONE сообщении

  Result      := 1;

end;

////////////////////////////////////////////////////////////////////////////

//стоп проигывание wav файла

procedure TSysWaves.StopWavePlay;

begin

// если устройство не является открытым, возвращаться...

  if not FDeviceOpened then Exit;

// стоп игра

  waveOutReset(FWaveOut);

// стоп таймер

  Timer1.Enabled := FALSE;

  FRecorderMode := recModeOff;

  FMoreToPlay   := FALSE;

// закройте устройство и освободите память заголовков

  CloseWaveDevicePlay;

end;

//====================работа с сообщениями wave=================================

//вызывается если устройство завершило передачу данных в блок памяти, установленный

//процедурой waveInAddBuffer;

procedure TSysWaves.MMWimData(var msg: TMessage);

var

  pwavehdrtmp : PWAVEHDR;

begin

// Сделанный буфер регистрации, выпишите это

  pwavehdrtmp := PWAVEHDR(msg.lparam);

  if WriteWaveBuffer(pwavehdrtmp.dwBytesRecorded) <> 0 then StopWaveRecord;

  if FRecorderMode <> recModeOff then  AddNextBuffer //буфер в очередь

  else

    CloseWaveDeviceRecord;// стоп запись

end;

//////////////////////////////////////////////////////////////////////////////

//Сделать проигрывание очередного волнового буфера, если проигран предыдущий.

procedure TSysWaves.MMWomDone(var msg: TMessage);

begin

  if FMoreToPlay then  QueueNextBuffer

  else

    StopWavePlay;

end;

/////////////////////////////////////////////////////////////////////////////

// посылается, когда устройство закрывается функцией waveOutClose;

procedure TSysWaves.MMWomClose(var msg: TMessage);

begin

  FDeviceOpened := FALSE;

end;

////////////////////////////////////////////////////////////////////////////

// Запись записаных даных в временый файл

function TSysWaves.WriteWaveBuffer(size : UINT) : integer;

begin

  Result := 0;

  if size = 0 then Exit;

  if _lwrite(FTmpFileHandle, FWaveMem[FBufIndex], size) <> size then begin

    errormsg('Ошибка записи данных во временный файл.');

    Result := -1;

    Exit;

  end;

  Inc(FByteDataSize, size);

end;

{************************Other*******************************************************}

////////////////////////////////////////////////////////////////////////////

//вызывает окно выбора кодека

procedure TSysWaves.GetFormatClick(Sender: TObject);

begin

  GetWaveFormat;  //функция вызывающая визуальный выбор кодека

  GetFormatTag.Caption  := FFormatTag; //формат

  GetFormatDesc.Caption := FFormatDesc; //его характеристики

  SaveConf.Enabled:=true;

end;

////////////////////////////////////////////////////////////////////////////

//останавливает проигрывание записи и устанавливает запись на начало

procedure TSysWaves.StopClick(Sender: TObject);

begin

  StopWavePlay;

end;

//////////////////////////////////////////////////////////////////////////////

//при изменениях настроек конфигурации разблокировать кнопку сохранения

procedure TSysWaves.RadioButton1Click(Sender: TObject);

begin

  SaveConf.Enabled:=true;

end;

////////////////////////////////////////////////////////////////////////////

// выводит сообщение Msg на  DisplayMemo

procedure TSysWaves.Display(Msg : String);

var

  i:Integer;

begin

  if DisplayMemo.Lines.Count > 100 then begin //если число линий >100 то

//удаляются 50 первых линий

    for I := 1 to 50 do DisplayMemo.Lines.Delete(0);

  end;

  DisplayMemo.Lines.Add(Msg); //DisplayMemo выводит  Msg

end;

////////////////////////////////////////////////////////////////////////////

//Выводит сообщение об ошибках.

procedure TSysWaves.errormsg(msg : String);

begin

  Application.MessageBox(PChar(msg), 'Error', MB_OK);

end;

///////////////////////////////////////////////////////////////////////////

//сохранение настроек

procedure TSysWaves.SaveConfClick(Sender: TObject);

  var

  v:variant;

begin

  try

    ConfigFile:=TIniFile.Create(IncludeTrailingBackslash(ExtractFilePath(Application.ExeName))+'config.ini');

//сохранение параметров кодека

      ConfigFile.WriteInteger('WaveFormat','FormatTag',FWaveFormat.wFormatTag);

      ConfigFile.WriteInteger('WaveFormat','Channels',FWaveFormat.nChannels);

      v:=FWaveFormat.nSamplesPerSec;

      ConfigFile.WriteInteger('WaveFormat','SamplesPerSec',v);

      v:=FWaveFormat.nAvgBytesPerSec;

      ConfigFile.WriteInteger('WaveFormat','AvgBytesPerSec',v);

      ConfigFile.WriteInteger('WaveFormat','BlockAlign',FWaveFormat.nBlockAlign );

      ConfigFile.WriteInteger('WaveFormat','BitsPerSample',FWaveFormat.wBitsPerSample);

      ConfigFile.WriteInteger('WaveFormat','Size',FWaveFormat.cbSize);

//сохранение параметров работы с модемом

      if RadioButton1.Checked then ConfigFile.WriteBool('DeviceMode','AutoAnswer',true)

      else  ConfigFile.WriteBool('DeviceMode','AutoAnswer',false);

      if CheckBox1.Checked then ConfigFile.WriteBool('DeviceMode','Pulse',true)

      else  ConfigFile.WriteBool('DeviceMode','Pulse',false);

      ConfigFile.WriteInteger('DeviceMode','NumRings',StrToInt(MaskEdit1.Text));

      ConfigFile.WriteInteger('DeviceMode','TimeReg',StrToInt(MaskEdit2.Text));

//настройки телефонной гарнитуры     

      ConfigFile.WriteInteger('VolGain','HeadSetVolume',HeadSetVolume.Position);

      ConfigFile.WriteInteger('VolGain','HeadSetGain',HeadSetGain.Position);

      ConfigFile.WriteInteger('VolGain','HandSetVolume',HandSetVolume.Position);

      ConfigFile.WriteInteger('VolGain','HandSetGain',HandSetGain.Position);

    ConfigFile.Free;

    SaveConf.Enabled:=false;

  except

    errormsg('Ошибка сохранения настройки конфигурации!');

  end;

end;

////////////////////////////////////////////////////////////////////////////

//проигрывание и пауза выбранного файла

procedure TSysWaves.PlayClick(Sender: TObject);

begin

  if (Play.Caption = 'Пауза') and (FRecorderMode = recModePlay) then begin

    Play.Caption:='Играть';

    waveOutPause(FWaveOut);

    Timer1.Enabled:=false;

    exit;

  end;

  if  (Play.Caption = 'Играть') and (FRecorderMode = recModePlay) then begin

    waveOutRestart(FWaveOut);

    Timer1.Enabled:=true;

    Play.Caption:='Пауза';

    exit;

  end;

  if  (Play.Caption = 'Играть') and (FRecorderMode = recModeOff) then begin

//если чтение wav файла прошло успешно, то

    if ReadWaveFile=0 then begin

      Select.Enabled:=false;//блокирует кнопку отбора

      NoSelect.Enabled:=false;//блокирует кнопку Отмены отбора

      DelTrack.Enabled:=false;//блокирует кнопку удаления записи

      Stop.Enabled:=true;//разблокирует кнопку останова

      Play.Caption:='Пауза';// кнопку проигрывания

      StartWavePlay //Подготовка заголовков, добавление буферов, и начинаем проигрывание.

    end ;

  end;

end;

{******************таймеры используемые в программе********************************}

/////////////////////////////////////////////////////////////////////////////

//Таймер для обновления позиции trackbar1 и времени проигрывания

procedure TSysWaves.Timer1Timer(Sender: TObject);

var

min,sec:integer;

begin

  min:=0;//обнуление кол-ва минут

  trackbar1.Position:=trackbar1.Position+1;//увеличение позиции trackbar1 на 1

//обработка времени проигрывания для приемлего представления его на форме

  sec:=trackbar1.Position;

  if sec/60 >= 1 then  begin

    Min:=trunc(Sec/60);

    Sec:=trunc((Sec/60-Min)*60);

  end;

  Label11.Caption :=Format('%.2d:%.2d',[Min,Sec]);

end;

/////////////////////////////////////////////////////////////////////////////

//таймер для подсчета времени с начала состояния Connected

procedure TSysWaves.Timer3Timer(Sender: TObject);

begin

  inc(FTimeCounter);//увеличиваем счетчик времени на 1 секунду

  if FRecorderMode = recModeRecord then UpdateRecordDisplay

end;

{****************************************************************************}

//Включить отбор записей

procedure TSysWaves.SelectClick(Sender: TObject);

begin

  Datamodule1.WavBase.SetRangeStart;

  Datamodule1.WavBase.FieldByName('DateName').AsDateTime:=DateTimePicker1.Date;

  Datamodule1.WavBase.SetRangeEnd;

  Datamodule1.WavBase.FieldByName('DateName').AsDateTime:=DateTimePicker2.Date;

  Datamodule1.WavBase.ApplyRange;

end;

//отменить отбор

procedure TSysWaves.NoSelectClick(Sender: TObject);

begin

  Datamodule1.WavBase.CancelRange;

end;

//удаление из базы текущей записи

procedure TSysWaves.DelTrackClick(Sender: TObject);

begin

  FFileName:= IncludeTrailingBackslash(ExtractFilePath(Application.ExeName)) +'WavBase\'+ datamodule1.WavBase.FieldByName('FileName').AsString;

  if FileExists(FFileName) then DeleteFile(FFileName);

  Datamodule1.WavBase.Delete;

end;

//При закрытии формы закрытие базы данных

procedure TSysWaves.FormClose(Sender: TObject; var Action: TCloseAction);

begin

  Datamodule1.WavBase.Close;

end;

//при изменении обьема звука наушников

procedure TSysWaves.HeadSetVolUpDownChangingEx(Sender: TObject;

  var AllowChange: Boolean; NewValue: Smallint;

  Direction: TUpDownDirection);

begin

   HeadSetVolume.Position:=2*NewValue;

   SaveConf.Enabled:=true;

end;

//при изменении коэффициента усиления звука наушников

procedure TSysWaves.HeadSetGainUpDownChangingEx(Sender: TObject;

  var AllowChange: Boolean; NewValue: Smallint;

  Direction: TUpDownDirection);

begin

   HeadSetGain.Position:=2*NewValue;

    SaveConf.Enabled:=true;

end;

//при изменении обьема звука микрофона

procedure TSysWaves.HandSetVolUpDownChangingEx(Sender: TObject;

  var AllowChange: Boolean; NewValue: Smallint;

  Direction: TUpDownDirection);

begin

   HandSetVolume.Position:=2*NewValue;

    SaveConf.Enabled:=true;

end;

 //при изменении коэффициента усиления звука микрофона

procedure TSysWaves.HandSetGainUpDownChangingEx(Sender: TObject;

  var AllowChange: Boolean; NewValue: Smallint;

  Direction: TUpDownDirection);

begin

  HandSetGain.Position:=2*NewValue;

   SaveConf.Enabled:=true;

end;

end.

Модуль данных

unit DataMode;

interface

uses

  SysUtils, Classes, DB, DBTables,bde;

type

  TDataModule1 = class(TDataModule)

    WavBase: TTable;

    DataSource1: TDataSource;

    WavBaseID: TAutoIncField;

    WavBaseDateName: TDateField;

    WavBaseTimeName: TTimeField;

    WavBaseUserName: TStringField;

    WavBaseFileName: TStringField;

    procedure WavBaseAfterCancel(DataSet: TDataSet);

  private

    { Private declarations }

  public

    { Public declarations }

  end;

var

  DataModule1: TDataModule1;

implementation

{$R *.dfm}

//сброс кэша на диск с помощью механизма BDE

procedure TDataModule1.WavBaseAfterCancel(DataSet: TDataSet);

begin

   Check(dbiSaveChanges(WavBase.Handle));

end;

end.

Модуль со справочной информацией

unit About;

interface

uses

  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,

  Dialogs, StdCtrls, ExtCtrls;

type

  TAbouts = class(TForm)

    Panel1: TPanel;

    ProductName: TLabel;

    Version: TLabel;

    Copyright: TLabel;

    Label2: TLabel;

    OKButton: TButton;

    ProgramIcon: TImage;

    procedure OKButtonClick(Sender: TObject);

  private

    { Private declarations }

  public

    { Public declarations }

  end;

var

  Abouts: TAbouts;

implementation

{$R *.dfm}

//При нажатии кнопки 'Ок'

procedure TAbouts.OKButtonClick(Sender: TObject);

begin

  close;

end;

end.

Модуль выбора интерфейса

unit VarTo;

interface

uses

  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,

  Dialogs, StdCtrls, Buttons;

type

  TVarS = class(TForm)

    GroupBox1: TGroupBox;

    RadioButton1: TRadioButton;

    RadioButton2: TRadioButton;

    BitBtn1: TBitBtn;

    BitBtn2: TBitBtn;

    UserName: TEdit;

    procedure BitBtn2Click(Sender: TObject);

    procedure BitBtn1Click(Sender: TObject);

    procedure RadioButton2Click(Sender: TObject);

    procedure RadioButton1Click(Sender: TObject);

  private

    { Private declarations }

  public

    { Public declarations }

  end;

var

  VarS: TVarS;

implementation

{$R *.dfm}

//При нажатии кнопки 'Выход'

procedure TVarS.BitBtn2Click(Sender: TObject);

begin

  Application.Terminate;

end;

//При нажатии кнопки 'Вход'

procedure TVarS.BitBtn1Click(Sender: TObject);

begin

  if RadioButton1.Checked then VarS.Tag:=1;

  if RadioButton2.Checked then VarS.Tag:=2;

  close;

end;

//При выборе интерфейса - администратор

procedure TVarS.RadioButton2Click(Sender: TObject);

begin

  UserName.Enabled:=false;

end;

//При выборе интерфейса - пользователь

procedure TVarS.RadioButton1Click(Sender: TObject);

begin

  UserName.Enabled:=true;

end;

end.