Система регистрации речи диспетчерских переговоров
Министерство образования РФ
Факультет К защите
Специальность Зав. кафедрой_____________
“____”_____________200 г.
ПОЯСНИТЕЛЬНАЯ ЗАПИСКА
к дипломной работе на тему
Система регистрации речи диспетчерских переговоров.
Дипломник_______________________ (______________________)
Руководитель работы_______________ (______________________)
Консультант по
Экономической части_______________ (_______________________)
Консультант кафедры_______________ (_______________________)
“___16___”____июня_______________2005 г.
Die Inhaltsangabe.
Das gegebene Diplomprojekt betrachtet das Problem des Registrierunges der Rede in den Dispatcherverhandlungen. Das Programm ist mit der Nutzung der Programmiersprache - Delphi7, des Programminterfaces Telefonie (TAPI) entwickelt. Es wird auch das Untersystem der Kompression des Lautes verwendet, das den Anwendungen den Satz der Servicemittel für das Umwandeln der lautlichen Formate und anderer Arten der Bearbeitung der lautlichen Daten gewährt. Das System des Registrierunges der Rede funktioniert unter Leitung des Betriebssystemes Windows XP und bei Vorhandensein von dem Mechanismus BDE für die Arbeit mit den Datenbasen.
Содержание
TOC \o "1-3" \n 1 Введение. Технико-экономическое обоснование темы........................... 7
2 Обзор форматов преобразования звуковых данных.................................. 15
2.1 Отличия цифрового представления сигналов от аналогового................................ 15
2.2 Способы представления звука в цифровом виде.......................................................... 17
2.3 Особенности восприятия речевых данных человеком.............................................. 20
2.4 Диспетчер сжатия звука.................................................................................................... 21
2.5 Универсальные кодеки...................................................................................................... 22
2.6 Кодеки для сжатия только речи....................................................................................... 37
2.7 Рекомендации по выбору форматов................................................................................ 40
3 Программная реализация системы регистрации речи диспетчерских переговоров............................................................................................................................... 42
3.1 Общее описание программного обеспечения реализующего разработанный алгоритм 42
3.2 Программный интерфейс телефонии (TAPI).................................................................. 46
3.3 Обработка звуковых файлов в Windows........................................................................ 54
3.4 Подсистема сжатия звука в Windows............................................................................ 65
3.5 Работа с базами данных в DELPHI.................................................................................. 86
3.6 Система регистрации речи диспетчерских переговоров............................................ 95
4 Экспериментальная часть........................................................................................ 103
5 Экономическая часть................................................................................................. 105
5.1 План выполнения НИР..................................................................................................... 105
5.3 Составление сметы затрат и определение цены на НИР.......................................... 106
5.3 Оценка экономической эффективности НИР............................................................ 110
6 Безопасность и экологичность проекта........................................................ 111
6.1 Вступление......................................................................................................................... 111
6.2 Анализ опасных и вредных факторов, воздействующих на разработчика при разработке данной системы......................................................................................................................................... 112
6.2.1 Микроклимат рабочей зоны разработчика............................................................ 113
6.2.2 Освещение рабочего места...................................................................................... 114
6.2.3 Воздействие шума на разработчика. Защита от шума........................................ 115
6.2.4 Опасность повышенного уровня напряженности электромагнитного поля.....
…………………............................................................................................................................... 116
6.2.5 Электробезопасность. Статическое электричество........................................... 118
6.3 Организация рабочего места разработчика................................................................ 119
6.4 Анализ пожарной безопасности.................................................................................... 121
6.5 Расчет искусственного освещения............................................................................. 124
7 ЗаКЛЮЧЕНИЕ........................................................................................................................ 128
Список литературы............................................................................................................ 129
Приложение 1................................................................................................................................ 132
1
В связи с развитием рыночных отношений в России и необходимостью сокращения разрыва в технологическом отставании России от западных стран, актуальным становится эффективное использование новых информационных технологий. Информационный бизнес, являясь составной частью бизнеса, придает общее ускорение развитию экономики.
На экономику предприятий, связанных с эксплуатацией вычислительной техники и программного обеспечения влияют несколько факторов. Первый — связан с динамическими изменениями в среде пользователей продуктов и услуг. В новых условиях пользователи экономно относятся к средствам, рационально стараются пользоваться услугами вычислительных центров. Второй — массовое использование персональных ЭВМ, которые существенным образом изменили структуру парка ЭВМ и программного обеспечения. Третий — изменение формы собственности предприятий, тем самым изменилась ситуация на информационном рынке. Четвертый — зародившийся и развивающийся рынок программных продуктов и услуг.
В результате влияние этих факторов возникает как следствие повсеместное распространение персональных ЭВМ, и сопутствующих им компьютерных составляющих и принадлежностей (модемы, принтеры, сканеры и т. д.), а также программных продуктов обслуживающих эту технику или решающую иные производственные и экономические задачи (ОС Windows, программы 1C, Adobe Photoshop и т.д.).
Если в качестве предприятия выступает таксопарк, то появляется много производственных и экономических задач которые возможно решить с помощью технических и программных средств. Рассмотрим одну из таких задач.
В любом таксопарке есть диспетчеры, которые принимают звонки (заказы) от клиентов. Начальнику может понадобиться выяснить, кто именно из диспетчеров принимал звонок (заказ) от клиента в конкретный день или в конкретное время, а также прослушать, что это был за заказ, представляющий собой звуковое сообщение (разговор диспетчера с клиентом). Итак, возникает такая задача: диспетчер должен отчитаться за требуемый период и в случае необходимости предоставить суть заказа в конкретное время.
Решение задачи можно выразить в следующих рекомендациях:
1) Определить технические средства необходимые для решения данной задачи
2) Определить программные средства
3) Разработать алгоритм программной реализации этой задачи
4) А также решить сопутствующую проблему сжатия звуковых данных
Разберем эти этапы более подробно.
1) Совершенно ясно, что необходим компьютер. Говорить о таких составляющих компьютера как процессор, объем оперативной памяти, емкость диска практически не приходится, так как мощность современных компьютеров растет огромными темпами. Так что можно лишь в качестве рекомендации указать конфигурацию, при которой тестировалась описанная ниже программа: процессор Athlon 1000, объем оперативной памяти 128Mb, емкость диска 80Gb.
Когда появились устройства передачи и приема данных через телефонные линии, модемы, разработчики "внедрили" способность приема и передачи звука и в эти устройства. Это результат обычного стремления совместить как можно больше функциональных возможностей в одном устройстве. Модем должен поддерживать голосовые функции на аппаратно-программном уровне.
Определить, голосовой модем или нет, можно по наличию слова Voice в названии модема. Если такового термина нет или по ряду причин определение затруднительно, то можно "опознать" модем по внешним признакам, например по наличию разъемов SPK и MIC. Они предназначены для подключения телефонной гарнитуры (наушники с микрофоном) или просто микрофона и активной акустической системы. Голосовые модемы можно разделить на две категории с функцией Speakerphone или Hands free и без этой функции.
Модем, поддерживающий функцию Speakerphone или Hands free (переводится это как "громкоговоритель" или "свободные руки", что, в принципе, означает одно и то же), позволяет не только воспроизводить звук в телефонной линии и в режиме автоответчика записывать звук из нее, но и использовать модем как обычный телефонный аппарат. Это удобно для оператора, отвечающего, к примеру, на телефонные звонки, которому при этом необходимо вести записи (прием объявлений, телефонограмм), работать с компьютером (справочная служба и т. д.), в общем, нуждающемся в том, чтобы руки были свободны, а придерживаемая плечом (в большинстве случаев) телефонная трубка не стесняла движений.
Итак, для работы компьютера с телефонной сетью, по которой клиент связывается с диспетчером необходим голосовой модем.
Рис.1
Модем ACORP M-56EMSF-2 (рис.1) создан специально для максимально надёжной и быстрой работы. Производители использовали весь свой накопленный опыт и учли все особенности эксплуатации подобных модемов в российских условиях. И из ниже приведенных характеристик видно, что он подходит для нашей задачи.
Поддержка всех основных протоколов передачи данных:
· ITU-T V.92
· ITU-T V.90
· ITU-T V.34+
· ITU-T V.34
· ITU-T V.32b
· ITU-T V.32
· ITU-T V.23C
· ITU-T V.22B
· ITU-T V.22
· ITU-T V.21
· ITU-T BEL 212
· ITU-T BEL 103
Протокол коррекции ошибок V.42 Протокол коррекции ошибок MNP4 Протокол сжатия данных MNP5 Протокол сжатия данных V.42bis Протокол сжатия данных V.44 (максимально возможный размер словаря компрессии).
Работа с факсом:
· Класс передачи факсовых сообщений Class 1,1.0,2
· Поддерживаемые протоколы согласно стандарту ITU-T: V.17, V.26ter, V.27ter, V.29
· Возможность принимать \ передавать факсимильные сообщения на обычный факсимильный аппарат.
Голосовые возможности:
· Автоматический прием голосовых и факсимильных сообщений аппаратным способом.
· Модем поддерживает все основные «голосовые» функции, реализация спикерфона (работа в режиме телефона) максимально упрощена. Для этого достаточно подключить микрофон и наушники к специальным гнёздам.
· Поставляемое в комплекте ПО превратит ваш компьютер с установленным модемом в полноценный автоответчик, электронный секретарь. Причем Вы без труда сможете управлять вашим «голосовым» офисом, с помощью тонального набора, даже находясь вдали от дома или офиса.
Особенности модема:
· Уровень выходного сигнала от -0 до –15db
· Регулировка скорости передачи данных и «сверху» и «снизу».
· 100% настройка сигнала «Линия занята»
· Повышенная чувствительность приемника.
· Расширенная индикация состояния модема.
· Бесшумный набор номера в импульсном режиме.
· Дополнительное гнездо для подключения параллельного телефона
Все модемы Acorp 56К адаптированы к российским телефонным линиям и отлично распознают сигналы ATC.
Выбор звуковой карты для проигрывания звука влияет лишь на качество воспроизведения, а, следовательно, можно воспользоваться и звуковой картой, встроенной в материнскую плату компьютера, ставшей практически стандартом (например, C-Media).
Выбор телефонной гарнитуры (наушники с микрофоном) также произвольный и зависит от того в каком качестве обслуживания заинтересован пользователь.
Итак, схема соединения технических средств выглядит так:
Звуковая карта |
Микрофон |
Телефонная сеть |
Наушники |
Модем |
ПЭВМ |
Рис.2
2) Для взаимодействия технических средств и реализации поставленной задачи необходимы программные средства:
Операционная система (ОС) устанавливаемая на компьютере - это важнейшая часть системного программного обеспечения, которая организует процесс выполнения задач, распределяя для этого ресурсы рабочей станции, управляя работой всех ее устройств и взаимодействием с пользователем. ОС Windows имеет наибольшее распространение, и большинство современных предприятий ориентированы на это семейство ОС. Будем использовать ОС WindowsXP – последняя выпущенная версия ОС Windows на текущий момент компанией Microsoft.
А также язык программирования для создания программной реализации поставленной задачи. Язык программирования Delphi - это комбинация нескольких важнейших технологий:
· Высокопроизводительный компилятор в машинный код
· Объектно-ориентированная модель компонент
· Визуальное (а, следовательно, и скоростное) построение приложений из программных прототипов
· Масштабируемые средства для построения баз данных
Будем использовать Delphi 7.0.
И, наконец, 3 и 4 этапы являются целью данной работы – необходимо составить алгоритм обслуживающий предоставленные технические средства и удовлетворяющий параметрам поставленной задачи. А также решить возникающую при записи заказа (разговора) проблему сжатия звуковых данных для экономии свободной емкости диска.
2 Обзор форматов преобразования звуковых данных
2.1 Отличия цифрового представления сигналов от аналогового
Традиционное аналоговое представление сигналов основано на подобии (аналогичности) электрических сигналов (изменений тока и напряжения) представленным ими исходным сигналам (звуковому давлению, температуре, скорости и т.п.), а также подобии форм электрических сигналов в различных точках усилительного или передающего тракта. Форма электрической кривой, описывающей (также говорят - переносящей) исходный сигнал, максимально приближена к форме кривой этого сигнала.
Такое представление наиболее точно, однако малейшее искажение формы несущего электрического сигнала неизбежно повлечет за собой такое же искажение формы и сигнала переносимого. В терминах теории информации, количество информации в несущем сигнале в точности равно количеству информации в сигнале исходном, и электрическое представление не содержит избыточности, которая могла бы защитить переносимый сигнал от искажений при хранении, передаче и усилении.
Цифровое представление электрических сигналов призвано внести в них избыточность, предохраняющую от воздействия паразитных помех. Для этого на несущий электрический сигнал накладываются серьезные ограничения - его амплитуда может принимать только два предельных значения - 0 и 1.
Вся зона возможных амплитуд в этом случае делится на три зоны: нижняя представляет нулевые значения, верхняя - единичные, а промежуточная является запрещенной - внутрь нее могут попадать только помехи. Таким образом, любая помеха, амплитуда которой меньше половины амплитуды несущего сигнала, не оказывает влияния на правильность передачи значений 0 и 1. Помехи с большей амплитудой также не оказывают влияния, если длительность импульса помехи ощутимо меньше длительности информационного импульса, а на входе приемника установлен фильтр импульсных помех.
Сформированный таким образом цифровой сигнал может переносить любую полезную информацию, которая закодирована в виде последовательности битов - нулей и единиц; частным случаем такой информации являются электрические и звуковые сигналы. Здесь количество информации в несущем цифровом сигнале значительно больше, нежели в кодированном исходном, так что несущий сигнал имеет определенную избыточность относительно исходного, и любые искажения формы кривой несущего сигнала, при которых еще сохраняется способность приемника правильно различать нули и единицы, не влияют на достоверность передаваемой этим сигналом информации. Однако в случае воздействия значительных помех форма сигнала может искажаться настолько, что точная передача переносимой информации становится невозможной - в ней появляются ошибки, которые при простом способе кодирования приемник не сможет не только исправить, но и обнаружить. Для еще большего повышения стойкости цифрового сигнала к помехам и искажениям применяется цифровое избыточное кодирование двух типов: проверочные (EDC - Error Detection Code, обнаруживающий ошибку код) и корректирующие (ECC - Error Correction Code, исправляющий ошибку код) коды.
Цифровое кодирование состоит в простом добавлении к исходной информации дополнительных битов и/или преобразовании исходной битовой цепочки в цепочку большей длины и другой структуры. EDC позволяет просто обнаружить факт ошибки - искажение или выпадение полезной либо появление ложной цифры, однако переносимая информация в этом случае также искажается; ECC позволяет сразу же исправлять обнаруженные ошибки, сохраняя переносимую информацию неизменной. Для удобства и надежности передаваемую информацию разбивают на блоки (кадры), каждый из которых снабжается собственным набором этих кодов.
Кроме целей помехозащиты, информация в цифровом сигнале может быть подвергнута также линейному или канальному кодированию, задача которого - оптимизировать электрические параметры сигнала (полосу частот, постоянную составляющую, минимальное и максимальное количество нулевых/единичных импульсов в серии и т.п.) под характеристики реального канала передачи или записи сигнала.
Полученный несущий сигнал, в свою очередь, также является обычным электрическим сигналом, и к нему применимы любые операции с такими сигналами - передача по кабелю, усиление, фильтрование, модуляция, запись на магнитный, оптический или другой носитель и т.п. Единственным ограничением является сохранение информационного содержимого - так, чтобы при последующем анализе можно было однозначно выделить и декодировать переносимую информацию, а из нее - исходный сигнал.
2.2 Способы представления звука в цифровом виде
Исходная форма звукового сигнала - непрерывное изменение амплитуды во времени - представляется в цифровой форме с помощью "перекрестной дискретизации" - по времени и по уровню.
Согласно теореме Котельникова, любой непрерывный процесс с ограниченным спектром может быть полностью описан дискретной последовательностью его мгновенных значений, следующих с частотой, как минимум вдвое превышающей частоту наивысшей гармоники процесса; частота Fd выборки мгновенных значений (отсчетов) называется частотой дискретизации.
Из теоремы следует, что сигнал с частотой Fa может быть успешно дискретизирован по времени на частоте 2Fa только в том случае, если он является чистой синусоидой, ибо любое отклонение от синусоидальной формы приводит к выходу спектра за пределы частоты Fa. Таким образом, для временной дискретизации произвольного звукового сигнала (обычно имеющего, как известно, плавно спадающий спектр), необходим либо выбор частоты дискретизации с запасом, либо принудительное ограничение спектра входного сигнала ниже половины частоты дискретизации.
Одновременно с временной дискретизацией выполняется амплитудная - измерение мгновенных значений амплитуды и их представление в виде числовых величин с определенной точностью. Точность измерения (двоичная разрядность N получаемого дискретного значения) определяет соотношение сигнал/шум и динамический диапазон сигнала (теоретически это - взаимно-обратные величины, однако любой реальный тракт имеет также и собственный уровень шумов и помех).
Полученный поток чисел (серий двоичных цифр), описывающий звуковой сигнал, называют импульсно-кодовой модуляцией или ИКМ (Pulse Code Modulation, PCM), так как каждый импульс дискретизованного по времени сигнала представляется собственным цифровым кодом.
Чаще всего применяют линейное квантование, когда числовое значение отсчета пропорционально амплитуде сигнала. Из-за логарифмической природы слуха более целесообразным было бы логарифмическое квантование, когда числовое значение пропорционально величине сигнала в децибелах, однако это сопряжено с трудностями чисто технического характера.
Временная дискретизация и амплитудное квантование сигнала неизбежно вносят в сигнал шумовые искажения, уровень которых принято оценивать по формуле 6N + 10lg (Fдискр/2Fмакс) + C (дБ), где константа C варьируется для разных типов сигналов: для чистой синусоиды это 1.7 дБ, для звуковых сигналов - от -15 до 2 дБ. Отсюда видно, что к снижению шумов в рабочей полосе частот 0..Fмакс приводит не только увеличение разрядности отсчета, но и повышение частоты дискретизации относительно 2Fмакс, поскольку шумы квантования "размазываются" по всей полосе вплоть до частоты дискретизации, а звуковая информация занимает только нижнюю часть этой полосы.
В большинстве современных цифровых звуковых систем используются стандартные частоты дискретизации 44.1 и 48 кГц, однако частотный диапазон сигнала обычно ограничивается возле 20 кГц для оставления запаса по отношению к теоретическому пределу. Также наиболее распространено 16-разрядное квантование по уровню, что дает предельное соотношение сигнал/шум около 98 дБ. В студийной аппаратуре используются более высокие разрешения - 18-, 20- и 24-разрядное квантование при частотах дискретизации 56, 96 и 192 кГц. Это делается для того, чтобы сохранить высшие гармоники звукового сигнала, которые непосредственно не воспринимаются слухом, но влияют на формирование общей звуковой картины.
Для оцифровки более узкополосных и менее качественных сигналов частота и разрядность дискретизации могут снижаться; например, в телефонных линиях применяется 7- или 8-разрядная оцифровка с частотами 8..12 кГц.
Представление аналогового сигнала в цифровом виде называется также импульсно-кодовой модуляцией (ИКМ, PCM - Pulse Code Modulation), так как сигнал представляется в виде серии импульсов постоянной частоты (временная дискретизация), амплитуда которых передается цифровым кодом (амплитудная дискретизация). PCM-поток может быть как параллельным, когда все биты каждого отсчета передаются одновременно по нескольким линиям с частотой дискретизации, так и последовательным, когда биты передаются друг за другом с более высокой частотой по одной линии.
2.3 Особенности восприятия речевых данных человеком.
Некоторые факты о восприятии звука
· Частотный спектр воспринимаемый человеком (примерно) от 20 Hz до 20 kHz, наибольшая чувствительность в диапазоне от 2 до 4 KHz.
· Динамический диапазон (от самых тихих воспринимаемых звуков до самых громких) около 96 dB (более чем 1 к 30000 по линейной шкале).
· Общеизвестно, что человек в состоянии различить изменение частоты на 0.3% на частоте порядка 1kHz.
· Если два сигнала различаются менее чем на 1дб по амплитуде - они трудноразличимы. Разрешение по амплитуде зависит от частоты, и наибольшая чувствительность наблюдается в диапазоне от 2 до 4 KHz.
· Пространственное разрешение (способность к локализации источника звука) - до 1 градуса.
· Звуки различной частоты распространяются в воздухе с разной скоростью. В результате высокочастотная часть спектра от источника находящегося на удалении от слушателя несколько запаздывает.
· Человек не в состоянии заметить внезапное исчезновение высоких частот, если оно не превышает порядка 2ms.
· Некоторые исследования показывают, что человек в состоянии ощущать частоты выше 20kHz. С возрастом частотный диапазон сужается.
Речь:
· Частотный спектр, несущий информацию в человеческой речи: от 500 Hz до 2 kHz
o Низкие частоты - басы и гласные
o Высокие частоты - согласные
· Лучшее сжатие речи достигается с использованием параметрических кодеров (LPC, CELP, и пр.), пытающихся представить речь как набор параметров некоторой речевой модели. Кодеки общего назначения (MPEG и др.), как правило, дают худшее сжатие.
2.4 Диспетчер сжатия звука
Во всех версиях Windows (начиная с Windows 95) присутствует специальный интерфейс, предназначенный для преобразования форматов звуковых данных. Он называется Audio Compression Manager (ACM), диспетчер сжатия звука. Этот интерфейс позволяет изменять частоту, разрядность, количество каналов, а также тип сжатия звуковых данных (format tag). При достаточной мощности процессора преобразование с успехом может выполняться в реальном времени. ACM включает в себя набор кодеков, которые, собственно, и выполняют необходимые преобразования. Кодек, компрессор/декомпрессор, - исполняемый файл с расширением *.acm. Они находятся в системной папке \Windows\system. Как правило, кодек позволяет осуществить не только сжатие, но и распаковку звуковых данных, т. е. восстановление исходного сигнала РСМ. (Хотя существуют кодеки только для воспроизведения). Пользователь может самостоятельно удалять ненужные ему кодеки, и может самостоятельно установить новые, что придает системе гибкость. После установки кодека все программы, пользующиеся системой ACM, получают возможность работать с этим форматом звуковых данных. Приложения непосредственно взаимодействуют только с диспетчером, который выбирает нужные драйверы, передает информацию между приложением и драйверами, и выполняет прочие функции по координации работы подсистемы
Практически все серьезные звуковые программы осуществляют преобразование форматов средствами интерфейса Audio Compression Manager (ACM): это и звуковые редакторы (Sound Forge, Cool Edit, Gold Wave и др.); и конвертеры (Wave Convert PRO); и проигрыватели звуковых файлов. WinAmp, например, с настройкой по умолчанию воспроизводит файлы с расширением *.mp3 через свой внутренний декодер, так называемый NullSoft MPEG Audio Decoder, а файлы с расширением *.wav - через систему ACM, даже если в них тот же самый MP3.
Дальше идет обзор наиболее распространенных кодеков системы Audio Compression Manager (ACM) и определены те области, в которых их применение могло бы быть оправданным и эффективным.
2.5 Универсальные кодеки
Под универсальностью подразумевается, прежде всего, пригодность для кодирования сигнала произвольной формы (например, музыки), сохраняя, насколько это возможно, все оттенки и особенности оригинала. Напротив, сжатие речи имеет целью только передачу смысла сообщения. Идеальный компрессор речи преобразовывал ее бы в текст, аналогично тому, как программы оптического распознавания символов преобразуют картинку в текст. По мере своего развития голосовые компрессоры неотвратимо приближаются к этому идеалу. Естественно, попытка сжать музыку компрессором, предназначенным для сжатия речи, приведет к тому, что от музыки просто ничего не останется. Яркий пример универсального формата - широко известный MP3. Он работает на особенностях слухового восприятия человека, не предъявляя жестких требований к структуре входного сигнала, соотношению частот и т. п. Речевые кодеки (например, Voxware MetaVoice) имеют значительно большую степень сжатия, однако удовлетворительное качество достигается только на сигналах, имеющих определённую структуру, то есть речевых. Рассмотрим эти два семейства форматов отдельно.
1) MPEG
Первый вариант стандарта группы MPEG (Motion Pictures Experts Group) появился в далеком 1992 году. Это был довольно несовершенный стандарт, предназначался он для сжатия видео и звука при спутниковом и кабельном цифровом вещании. О компьютерах и интернете тогда никто и не думал. Параметры этого стандарта (аудио): 48, 44.1, 32 КГц, mono, dual (два моно канала), стерео, интенсивное стерео (объединяются сигналы с частотой выше 2000 Гц.), m/s stereo (один канал переносит сумму - другой разницу).
Позже стандарт MPEG-1 был немного расширен и стал называться MPEG-2:
- Появились новые виды частот 16, 22.05, 24 КГц.
- Поддержка многоканальности - возможность иметь 5 полноценных каналов (left, center, right, left surround, right surround) + 1 низкочастотный (subwoofer).
- Появился AAC (Advanced Audio Coding - прогрессивное кодирование звука), стандарт - обеспечивает очень высокое качество звука со скоростью 64 kbps per channel (килобит в сек. на канал), возможно использовать 48 основных каналов, 16 низкочастотных каналов для звуковых эффектов, 16 многоязыковых каналов и 16 каналов данных. До 16 программ может быть описано используя любое количество элементов звуковых и других данных. Для AAC существуют три вида профиля - Main (используется, когда нет лишней памяти), Low Complexity (LC), Scalable Sampling Rate (SSR, требуется декодер с изменяемой скоростью приема данных).
MPEG Layer-3 Audio Codec for MSACM
Данный продукт разработан в немецком институте имени Фраунхофера - Fraunhofer Institut Integrierte Schaltungen IIS. Первоначально этот кодек был неотъемлемой частью программы MPEG Layer-3 Producer. Но теперь он распространяется сам по себе, в виде файла I3enc.exe размером 294 Кбайт. Встречается так же версия, названная "Fraunhofer MP3 Codec v1.063 (Radium Optimized)", в виде файла SetupI3c.exe размером 870 Кбайт. Обе версии функционально практически одинаковы.
На входе кодек воспринимает поток PCM, имеющий частоты дискретизации, перечисленные ниже в таблице1. Разрядность потока всегда должна быть 16 бит (это правило справедливо и для большинства других кодеков, 8-ми битная разрядность практически не применяется). Кодек работает как в стерео режиме, так и в моно. В таблице1 указана скорость потока сжатого звука и место, которое займет такая звукозапись в моно режиме (для стерео надо умножить значения на два).
Таблица1
_____________________________________________________________________
частота скорость сколько займет 1 час
дискретизации, потока, (приблизительно),
Hz kbit/s Mb
_____________________________________________________________________
48 000 64 28,125
56 24,6
48 21
_____________________________________________________________________
41 100 64 28,128
56 24,6
48 21
_____________________________________________________________________
32 000 64 28,128
56 24,6
48 21
_____________________________________________________________________
24 000 32 14
24 10
_____________________________________________________________________
22 050 32 14
24 10
_____________________________________________________________________
16 000 32 14
24 10
20 8,5
18 8
16 7
_____________________________________________________________________
12 000 20 8,5
18 8
16 7
8 3,5
_____________________________________________________________________
11 025 20 8,5
18 8
16 7
8 3,5
_____________________________________________________________________
8 000 16 7
8 3,5
_____________________________________________________________________
Заметим, что сжатие сигнала в реальном времени с качеством AUDIO CD - то есть 44100 Hz, 128 kbit/s, stereo, требует процессора не слабее Celeron 300A. При этом процессор будет полностью загружен и работать с другими приложениями станет практически невозможно. При уменьшении частоты дискретизации требования к процессору пропорционально снижаются. MP3 - один из самых "тяжелых" форматов по требованиям к процессору.
Особенность всей продукции Fraunhofer IIS - упорное игнорирование режима переменного битрета - VBR. Качество звука, получаемое при использовании этого кодека принято считать эталонным. Оно очень высокое, особенно если воспроизводить файлы через него же. Особо не рекомендуется смешивать продукцию разных фирм - сжимать, например, Xing Encoder'ом или Lame, а слушать через Fraunhofer IIS. Стандарты стандартами, но частотная коррекция в этих кодеках делается по-разному.
В комплект Windows Media Tools от Microsoft'а входит кодек, который называется MPEG Layer-3 Audio Codec (advanced). Его отличие от рассмотренной выше версии professional в том, что advanced - это урезанная, бесплатная демо-версия кодека, она поддерживает только частоты 24 000,
12000, 16 000 и 8 000 Hz. LAME ACM MP3 CODEC
Lame - продукт бесплатный, распространяется в виде исходных текстов. Разрабатывается он группой энтузиастов, что не могло не отразиться на качестве, и особенно на стабильности его работы. Как следствие, Lame можно рекомендовать для сжатия голосовой информации. Особо ценен в этом контексте режим VBR, при котором кодек уменьшает скорость передачи в некритичных местах - например, в паузах между словами.
В Lame появился режим заказного (среднего) битрейта (average bitrate - ABR), реализованный ранее в кодере OGG. По утверждению разработчиков, при одинаковом битрейте кодирование в ABR режиме должно быть не хуже, чем в обычном.
Q-Design realtime MPEG 1 Layer 1,2
Это тот же MPEG, однако, степень сжатия существенно меньше. Он сжимает примерно в 4-5 раз. Такой же коэффициент сжатия дает MS или IMA ADPCM, но, пожалуй, системные требования ADPCM поменьше будут. Зато Q-Design codec имеет утилиту Speed Control, которая позволяет изменять скорость воспроизведения прямо в процессе воспроизведения. 2) DivX WMA Audio Compressor
Исправленная версия кодеков Windows Media Audio (WMA), распространяется она в интернете под названием DivX.
Сетка частот, поддерживаемая кодеком - 48, 44, 32, 22, 16, 11, 8 kHz, для каждой частоты предлагается несколько (до семи) скоростей потока. Частоты 24 и 12 kHz не поддерживаются. Качество звука достаточно лишь для синтетической музыки (попса, танцевальная, техно...). Акустика звучит неадекватно. Очень хорошо этот кодек подходит для записи лекций, совещаний, разговорных передач на FM. Разборчивость речи стабильно 100-процентная.
3) WMА
WMA - это детище широко известной в мире компании Microsoft. Но все ли знают, как он к этой самой Microsoft попал? История происхождения формата WMA объясняет некоторые интересные особенности его звучания.
В 1998 году компания Voxware присоединилась к проекту TwinVQ и в его составе участвовала в разработке формата VQF. Компания отделилась от проекта и на основе разработок VQF создала новый формат, получивший название Voxware Audio Codec 4.0. Он стал первым алгоритмом сжатия, обеспечивающим качество 128Кб/с MP3-файлов при цифровом потоке в 64Кб/c. Заметив его высокие характеристики при кодировании речевых сигналов, крупные телефонные компании заинтересовались новой разработкой и даже стали устанавливать ее на свои цифровые АТС. Вскоре свой взор на продукты компании обратила и Microsoft, включив поддержку Voxware Audio Codec в свой Media Player. Дальше все пошло по отработанному уже сценарию: Microsoft покупает Voxware и финансирует доработку формата, получившего впоследствии имя Windows Media Audio. Главный вывод - WMA является, чуть ли не прямым потомком формата VQF, так что понятно, откуда появились его достоинства и проблемы.
Итак, по заявлениям разработчиков, WMA версии 7 выдает качество, не уступающее 128Кб/c MP3-файлу при сжатии 64Кб/c. Сравнению подверглись закодированные именно в таком сжатии файлы. В ней, кроме считки и бита, играет шикарный симфонический оркестр, записанным с очень высоким качеством. Для компрессии в MP3 была использована программа Audioactive Production Studio. Прослушанные на четырех различных системах, начиная от десятидолларовых офисных колонок, подключенных к безымянной звуковой плате, и заканчивая студийными акустическими мониторами Event, подключенными через усилитель Onkyo к ProTools MixOne посеребренными проводами, был поставлен диагноз: идентичны. Разумеется, профессиональные колонки выдали характерные особенности разных форматов - звучание действительно разное, но общее качество оказалось примерно на одном уровне. И это при том, что файл WMA был вдвое меньше MP3... Впрочем, все это вовсе не значит, что при компрессии 64Кб/с в WMA вы получите приемлемый звук, как это заявлено в красочных пресс-релизах. Он просто не хуже 128Кб/c MP3-файлов, которые сами более чем далеки от идеала.
Отличительной чертой WMA является полное обрезание звука выше 20КГц, а также непонятное заполнение шумами пауз в композициях. Также WMA довольно груб в обращении с динамическим диапазоном и вносит в него неслабые искажения. Пожалуй, это все выявленные пока недостатки формата. К плюсам же можно смело отнести, во-первых, очень быстрое кодирование файлов, а во-вторых, наилучшее среди современных форматов качество звука при очень сильном сжатии.
Формат WMA подходит для кодирования самых разных записей. Низкие и средние частоты в его исполнении хороши, но начиная с 8КГц он начинает своевольничать с частотами и всячески искажать их..
4) MS ADPCM
ADPCM - это адаптивное дифференциальное кодирование звуковых отсчетов. Строго говоря, этот формат нельзя назвать сжатием - так как сжатие предполагает необратимое удаление части информации о звуке. В то время как ADPCM представляет собой всего лишь другую, более экономичную, форму записи той же самой информации. Вместо абсолютного значения величины отсчета записывается некое число, равное изменению текущего отсчета по отношению к предыдущему. А так как скорость изменения звукового давления довольно небольшая, можно под запись этого числа выделить меньше разрядов, и получить соответствующую экономию.
Так и сделано в форматах MS и IMA ADPCM. Для записи разностей используется 4 разряда, вместо 16. Это дает нам экономию в 4 раза.
ADPCM всегда обеспечивает высочайшее качество звучания. Что и неудивительно - ведь это не "сжатие". Кодеки формата ADPCM имеют простое устройство, благодаря чему они работают в реальном времени даже на младших моделях 486 и старших 386. Этот формат - исторически первый, получивший широкое применение для записи музыки в компьютерном мире. Существуют реализации ADPCM даже под DOS . Когда еще никто ничего не слышал про MP3, формат ADPCM был единственной реальной возможностью высококачественного сжатия.
С ростом мощности компьютеров формат ADPCM сдал позиции формату MP3, который сжимает сильнее (в 10 раз) и шире поддерживается потребительским программным обеспечением. Но память он оставил после себя хорошую, как основа целой эпохи в развитии цифрового звука. 5) IMA ADPCM
Это версия ADPCM, разработанная в Interactive Multimedia Association (IMA). Несмотря на то, что принципы работы обеих реализаций ADPCM одинаковы, эти две реализации несовместимы между собой. Версия IMA работает быстрее версии MS, преимущество в скорости достигает 5 раз. IMA ADPCM - самый быстрый кодек из представленных в этом обзоре. Хотя возможности современных процессоров делают эту характеристику несущественной. Сегодня можно себе позволить писать прямо в MP3. Но если ставится задача специального характера - например, нужно записывать звук одновременно по сотне каналов, да еще параллельно с обычной работой, да еще на маломощной машине, - вот тут формату IMA ADPCM цены не будет. Исключительно быстрая штука. Качество звука на некоторых частотах - в пользу одной версии, на других - в пользу другой.
6) CCITT A-Law/u-Law G.711
Этот формат уменьшает разрядность с 16-ти до 8 бит, сохраняя данные в нелинейной, логарифмической форме. То есть, просто говоря, слабые звуки записываются с большой разрешающей способностью, а сильные звуки - наоборот, с маленькой разрешающей способностью. Такой поход отлично согласуется с характеристикой чувствительности человеческого слуха, которая является тоже логарифмической. Степень сжатия - в 2 раза. Линейное PCM кодирование невозможно использовать при разрядности 8 бит даже для записи голоса. Характерные цифровые искажения чрезвычайно сильны - так как слабые составляющие звука превращаются в очень неприятный для слуха скрежет.
7) Конвертер MS-PCM
Конвертер MS-PCM преобразует частоту дискретизации потоков PCM, количество каналов (моно - стерео), разрядность (поддерживается только 8 или 16 бит). Если требуется изменить более одной характеристики, программа, использующая этот кодек, должна организовать многошаговое преобразование (Multistep Format Conversion). Не рекомендуется применять передискретизацию без крайней необходимости - заметно деградирует качество звука. При преобразовании вверх система должна вставлять в поток РСМ отсчеты, полученные примитивной интерполяцией. Хуже при преобразовании вниз - система должна отфильтровать частоты, не укладывающиеся в диапазон, определенной теоремой Котельникова (Найквиста), и только после этого выкидывать отсчеты. Реализован ли алгоритм фильтрации в кодеке Microsoft, не известно. Но, зная, с кем мы имеем дело, логично предположить, что нет. А ведь это серьезный недостаток. Нарушая теорему Котельникова, мы имеем все шансы получить неустранимое искажение, наложение спектров. Вряд ли такой звук кому покажется нормальным. Но совсем плохо, когда исходная и конечная частота не кратны друг другу. Чтобы выполнить такое преобразование, придется преобразовывать сигнал в определенную промежуточную частоту, фильтровать и потом делать конечную частоту. После этой варварской "высшей математики", очевидно, о качестве звука можно прочно забыть.
8) VQF
Этот относительно молодой формат, разработанный компанией NTT несколько лет назад. Алгоритм кодирования широко не разглашается. В любом случае, сравнивая результаты кодирования в форматах VQF и MP3, можно заметить, что алгоритмы имеют очень мало общего и основаны на совершенно разных подходах к сжатию звука. Это проявляется, прежде всего, в том, что VQF-файлы звучат гораздо более естественно, чем MP3 и точно передают записи с широким динамическим диапазоном - то есть живую музыку. Так же в записях VQF значительно меньше искажений на средних и низких частотах. Зато на "верхах" он проигрывает MP3 - выше 15КГц наблюдается сильный завал частот, который особенно ощущается при кодировании шумов. Все это предполагает весьма своеобразную методику сжатия аудио.
Итак, в чем же заключаются преимущества VQF перед другими форматами? Самая сильная сторона формата - степень сжатия. VQF-файл с компрессией 80Кб/с по качеству идентичен MP3-файлу, записанному в 128Кб/c. То есть степень сжатия превосходит МР3 более чем на 30%. Минута звучания достойного качества в VQF занимает немногим больше 600Кб. Это действительно значительное преимущество.
Главный недостаток алгоритма - очень большое потребление системных ресурсов. При проигрывании VQF на каком-нибудь P166 на выполнение остальных задач процессор будет просто неспособен. Скорость кодирования файлов просто очень маленькая, 3-4 минуты звучания на P200MMX при полной остановке других приложений могут кодироваться минут двадцать. Некоторые кодировщики, впрочем, способны кодировать файлы за время значительно меньшее, чем время звучания самого кодируемого файла, но в их системных требованиях рекомендуется процессором типа Pentium 4.
Еще один серьезный недостаток VQF, который, впрочем, также касается владельцев не слишком "продвинутого" оборудования - на многих дешевых звуковых платах файлы VQF звучат просто ужасающе. Не вполне ясно, с чем связан подобный эффект, но факт остается фактом: если у вас десятидолларовая "пищалка", то и звук из VQF вы, скорее всего, получите соответствующий. Разработчики формата рекомендуют использовать Hi-Fi платы, красующиеся на полках магазинов с ценниками в $150 и выше. Впрочем, недорогие карты семейства SB Live!, а также другие достойно сделанные экземпляры все-таки воспроизводят VQF с приемлемым качеством. Похоже, что преобразователи на качественных звуковых платах, в отличие от дешевых поделок, способны сгладить некую "зернистость", получаемую при раскодировании VQF-потоков.
VQF очень хорош для акустических записей. Малые искажения, чуть "подрезанные" верхи и широта динамического диапазона делают его незаменимым форматом для записи живых инструментов и всевозможных гитар.
9) OGG Vorbis
Этот формат был опубликован летом 2000 года. В это же время появилась бета-версия его кодера.
Ogg - контейнер представляет собой виртуальный ящик, позволяющий хранить в себе различные данные. В случае с Ogg - это аудиопоток и текстовые данные: наименование песен, альбома, исполнителя и другие комментарии. В других случаях в контейнере может хранится несколько видео- и аудио-потоков с разными характеристиками, а также субтитры, меню, данные о главах, статичные изображения и так далее. Контейнер MP3 в этом смысле несколько ограничен, туда невозможно добавить дополнительные поля. Контейнер Ogg поддерживает ограниченное количество предопределённых полей (Title, Artist, Album, Track, Date, Genre, Comment), и неограниченное число полей Other с собственными заголовками и содержимым.
Соответственно, Vorbis - это название алгоритма сжатия звука. То есть, это CODEC (кодер/декодер), который в зависимости от настроек пользователя и своих алгоритмов решает, как именно нужно сжимать звуковые данные. Адаптивный цельнопреобразовательный алгоритм кодека Vorbis основан на том же принципе, что и MP3, а именно на MDCT (Modified Discrete Cosine Transform, модифицированное дискретное косинусное преобразование), но на этом сходство форматов заканчивается. Vorbis, в отличие от, например, MP3, поддерживает разрядность до 24 бит, частоту дискретизации до 192kHz и до 255 звуковых каналов (включая 5.1), таким образом опережая MPEG-2, WMA и Musepack.
Теперь перейдём к преимуществам Ogg Vorbis, которые можно понять и проанализировать:
- Формат Ogg Vorbis изначально оптимизирован для потокового вещания: степень сжатия может меняется автоматически в зависимости от условий передачи, пакеты не имеют предопределённого размера (минимального, максимального или ожидаемого), они (пакеты) могут быть обрезаны или повреждены - ничто из этого не вызовет сбоя воспроизведения, к тому же в контейнер встроен механизм коррекции ошибок;
- Благодаря тому, что Vorbis - "урождённый" VBR (variable bitrate) формат, он не привязан к "ступеням" битрейта (96, 112, 128, 160, 192...), а кодирует каждый кадр (frame) с тем битрейтом, который больше всего соответствует текущим условиям (это может быть и 113, и 178, и 234);
- В алгоритм кодека встроена функция "bitrate peeling" - возможность уменьшения битрейта без перекодирования;
- Данные, сжатые по алгоритму Vorbis, в среднем занимают меньше места по сравнению с данными, сжатыми по алгоритму MP3. Или, при одинаковом размере, будут звучать лучше;
- Ogg Vorbis идеально подходит в качестве стандарта передачи аудиоданных в глобальной сети, то есть является реальной заменой MP3 и WMA, а также подходит для хранения записей с качеством, близким к CD. Это доказывают многочисленные "слепые" тесты (когда участники теста не знают, каким алгоритмом зажат тот или иной файл - все они предварительно декодируются и предоставляются в формате WAV), проведённые независимыми исследователями.
- Эти исследования показывают, что на низких битрейтах (96 и менее) у Vorbis нет конкурентов, на средних он звучит идентично с WMA, а на высоких битрейтах (от 170 и выше) Vorbis опережают только AAC, Real Audio 8 и - иногда - Musepack. В то же время, качество MP3 на всех битрейтах отмечено как наихудшее.
- Ogg Vorbis всё чаще используется разработчиками программного обеспечения в своих продуктах (преимущественно в играх: LockOn, Heroes of Might and Magic IV, Unreal Tournament 2003, Vietnam, Код доступа: Рай, Crimsonland).
- кодек нашёл применение в качестве стандарта для китайского EVD - Enhanced Versatile Disc, замене DVD.
Теперь рассмотрим слабые стороны, их немного:
- важнейшим препятствием на пути Ogg Vorbis (как, в принципе, и любого другого формата) стоит консерватизм пользователей.
- немалую роль играет сопротивление софтверных компаний (как гигантов, так и средних компаний): несмотря на наличие всех исходных кодов и отсутствие лицензионных отчислений, разработчики или упорно игнорируют наличие альтернативных форматов, или вставляют им палки в колёса. Microsoft же, как всегда, агрессивно рекламирует своё детище - WMA, при этом, выставляя худшие стороны в лучшем свете: поддержка DRM, по мнению Microsoft, является величайшим благом для пользователя. Кстати, Windows кроме "родных" форматов WMA, MP3 и WAV наотрез отказывается воспроизводить прочие аудиофайлы.
- свою лепту вносят и производители мультимедийной техники, которые только к концу 2003 года начали потихоньку "раскачиваться" и встраивать поддержку Ogg Vorbis в плееры, диктофоны и блочные проигрыватели DVD. Иногда, правда, это делается за счёт других форматов (как поступила iRiver - пользователь может выбирать между WMA и Ogg, но вместе они быть не могут). Непонятно, почему это не делалось раньше.
· Еще один из недостатков формата OGG Vorbis - это относительная медленность упаковки и недоработанность кодеков. Впрочем, с оптимизацией программ для упаковки OGG и эти недостатки исчезнут.
2.6 Кодеки для сжатия только речи
Сжатие голосовых данных неразрывно связано с вокодерными методами. Вокодер - это некий прибор (теперь он для нас является черным ящиком) или алгоритм, который осуществляет анализ и формализацию структуры голосовой информации. Затем формализованные данные можно обрабатывать обычными математическими методами - сжимать их, преобразовывать, зашифровывать, редактировать и так далее.
Вокодерные методы позволяют добиться очень высокой степени сжатия (до 100 раз), но качество звука при этом получается более чем посредственное. В коммерческих кодеках редко применяется сжатие более чем в 30 раз из соображений сохранения минимального благозвучия фонограммы. Например, кодек Voxware MetaVoice позволяет разместить 1 минуту звучания в файле размером 25 Кb, что соответствует сжатию в 37 раз. Необходимо подчеркнуть, что оцифровку голоса рекомендуется проводить только при частоте 8 KHz, разрядности 16 bit, и в монофоническом режиме. Это стандарт, многие кодеки просто не поддерживают другие параметры. Характеристики наиболее широко распространенных кодеков сведены в таблицу 2. Степень сжатия указана относительно исходного 1-минутного файла PCM 8 KHz/16 bit/mono, размер которого - 938 Kb.
Таблица 2
формат | степень сжатия, раз (приблизительно) | 1 минута, Kb
MSN 13000 Baud 10 96
MSN 8000 Baud 15 61
MS GSM 6.10 10 96
DSP Group TrueSpeech 15 63
L&H CELP 4,8 25 36
L&H SBS 12 10 87
ACELP.net 5 25 37
ACELP.net 8,5 15 62
Сжатие голосовых сигналов широко применяется в IP-телефонии, которая без этого была бы невозможна. Недостаток всех перечисленных кодеков - они не обладают свойством изменения скорости потока данных в зависимости от передаваемого сигнала. А ведь разговорная речь, даже в случае монолога, содержит паузы, на время которых канал передачи можно закрывать, получая тем самым дополнительную экономию. Эффективная система передачи голоса обязательно должна обеспечивать подавление пауз. Режим переменного битрейта является родным в формате OGG Vorbis, который обеспечивает степень сжатия большую, чем MP3.
1) GSM 6.10
Этот кодек сжимает в 10 раз (приблизительно). Поддерживает только моно. Особенность кодека - у него есть панель настройки, на которой устанавливаются предельные частоты сжатия и воспроизведения. Качество звука среднее. Системные требования низкие - сжатие на 44 100 KHz в режиме реальном времени проходит уже на Pentium-100. 2) DSP Group TrueSpeech
Сжимает в 15 раз, то есть одна минута занимает 63 Kb. Особенность - поддерживает только исключительно частоту 8 KHz, моно. Мало этого, так еще этот кодек требует обязательно установленного флага "Non Realtime". Хотя, при установленном этом флаге прекрасно работает и в реальном времени. Качество звука несколько хуже, чем у GSM, но достаточное. Системные требования относительно низкие - работает в режиме реального времени, начиная с Pentium-75 или AMD-5x86-133 MHz. Можно рекомендовать такой кодек для архивирования больших объемов телефонных или диспетчерских переговоров. 3) MSN - Microsoft Network Audio codec
Название говорит само за себя. Степень сжатия - около 10 раз. Качество звука на 13 000 Baud - хорошее, а на 8 000 Baud - не очень. 4) Lermount & Haspie SBC/CELP
Фирма Lermount & Haspie известна своими системами распознавания речи, которые одно время лидировали на рынке. Кодеки SBC/CELP входят в состав программы Net Meeting, которая предназначена для общения по локальной сети. Кодеки отличаются большой степенью сжатия, однако, качество звука невысокое. 5) ACELP.net
Этот кодек о себе сообщает следующее: "ACELP.net audio encoder/decoder. For licensing please access http://www.sipro.com". Изготовлен он фирмой Sipro Lab Telecom Inc, Montreal. Видимо, разработка более современная, так как он сочетает значительную степень сжатия (до 25 раз) с хорошим качеством звука. Отсутствует хрипение, характерное для L&H CELP. Системные требования высокие. Поддерживает только моно, и только частоты 8000 и 16000 KHz. В целом производит хорошее впечатление. 2.7 Рекомендации по выбору форматов
Широкой публике не известен факт, что микрофонный вход во всех стандартных звуковых картах является монофоническим. Поэтому мы наблюдаем такие нелепые вещи, как, например, совет в уважаемом журнале "Компьютер-пресс" записать голосовое поздравление с микрофона в формате MP3 56kBit/s 24 kHz, Stereo. Вот Stereo здесь совсем ни к чему, и частота неоправданно высокая - для голоса вполне хватает 8000 Hz. Выбирать частоту выше - просто бессмысленно. Выбрав более подходящий формат, мы вместо файла размером 207 Kb (30 секунд звука) получаем файл размером всего 30 Kb - экономия в 7 раз.
При записи голоса оправдано выбирать частоты: 8000 Hz, - если источник - телефон или связная аппаратура; 12000 - если это радиопрограмма на длинных, средних, коротких волнах (в общем, с амплитудной модуляцией). При радиовещании на FM/УКВ с частотной модуляцией, согласно международным стандартам, диапазон передаваемого звука - от 20 до 15000 Hz. Таким образом, очевидно, что для записи такого сигнала оправдано выбрать частоту 32000 Hz. Впрочем, на практике хорошо идет и частота 22050 Hz. Более высокие частоты - просто бесполезный расход дискового пространства.
3
Общее описание программного обеспечения реализующего разработанный алгоритм
Основной идеей дипломного проекта, является реализация алгоритма обслуживающего предоставленные технические средства и удовлетворяющего параметрам поставленной задачи. Поэтому автором было принято решение не разрабатывать целиком всё программное обеспечение, а использовать имеющиеся в наличии компоненты, которые не решают поставленной задачи без построения автором соответствующего алгоритма. Эти инструменты были автором соответственным образом изучены и частично использованы при реализации алгоритма.
Исходя из ниже перечисленных достоинств автор остановился на таком языке программирования как Delphi:
1) Для кого предназначен Delphi
В первую очередь Delphi предназначен для профессионалов-разработчиков корпоративных информационных систем. Однако Delphi предназначен не только для программистов-профессионалов. Любой программист на Pascal способен практически сразу профессионально освоить Delphi. Специалисту, ранее использовавшему другие программные продукты, придется труднее, однако самое первое работающее приложение он сможет написать в течение первого же часа работы на Delphi. И, конечно же, открытая технология Delphi является мощным гарантом того, что инвестиции, сделанные в Delphi, будут сохранены в течение многих лет.
2) Высокопроизводительный компилятор в машинный код
В отличие от большинства Паскаль-компиляторов, транслирующих в p-код, в Delphi программный текст компилируется непосредственно в машинный код, в результате чего Delphi- приложения исполняются в 10-20 раз быстрее (особенно приложения, использующие математические функции). Готовое приложение может быть изготовлено либо в виде исполняемого модуля, либо в виде динамической библиотеки, которую можно использовать в приложениях, написанных на других языках программирования.
3) Открытая компонентная архитектура
Благодаря такой архитектуре приложения, изготовленные при помощи Delphi, работают надежно и устойчиво. Delphi поддерживает использование уже существующих объектов, включая DLL, написанные на С и С++, OLE сервера, VBX, объекты, созданные при помощи Delphi. Из готовых компонент работающие приложения собираются очень быстро.
4) Библиотека визуальных компонент
Эта библиотека объектов включает в себя стандартные объекты построения пользовательского интерфейса, объекты управления данными, графические объекты, объекты мультимедиа, диалоги и объекты управления файлами, управление DDE и OLE.
5) Компоненты доступа к базам данных и визуализации данных
Библиотека объектов содержит набор визуальных компонент, значительно упрощающих разработку приложений для СУБД с архитектурой клиент-сервер. Объекты инкапсулируют в себя нижний уровень - Borland Database Engine.
Предусмотрены специальные наборы компонент, отвечающих за доступ к данным, и компонент, отображающих данные. Компоненты доступа к данным позволяют осуществлять соединения с БД, производить выборку, копирование данных, и т.п.
Компоненты визуализации данных позволяют отображать данные виде таблиц, полей, списков. Отображаемые данные могут быть текстового, графического или произвольного формата.
Рис 3 Delphi: настраиваемая cреда разработчика
Ha cтpaницe Standard палитры компонентов сосредоточены стандартные для Windows интерфейсные элементы, без которых не обходится практически ни одна программа (рис 4).
Рис 4
B страницу Additonal помещены 18 дополнительных компонентов, с помощью которых можно разнообразить вид диалоговых окон (рис 5).
Рис 5
Страница Win32 содержит интерфейсные элементы для 32-paзpядныx
операционных систем Windows 95/98/NT/2000 (рис 6).
Рис 6
Cтpaницa BDE (рис.7) - здесь представлены компоненты, поддерживающие доступ к данным с помощью BDE - Table, Query, StoredProc и т. п. Mexaнизм BDE в равной степени успешно работает как с фaйл-cepвepными, так и с клиeнт-cepвepными БД. Кoмпoнeнты этой страницы есть во всех версиях Delphi.
Рис 7
Cтpaницa Data Controls. 15 кoмпoнeнтoв этoй cтpaницы пpeднaзнaчeны для визyaлизaции дaнныx, иx ввoдa и peдaктиpoвaния (рис.8).
Рис 8
Программный интерфейс телефонии (TAPI)
Microsoft Win32 прикладной программный интерфейс телефонии (TAPI) обеспечивает услуги, которые дают возможность прикладному разработчику добавить телефонную связь к приложениям, разработанным для операционных систем, которые поддерживают Microsoft ® Win32 ® API
Чтобы обеспечивать лучшую работу (выполнение) и поддержку на платформе Windows NT и на будущих выпусках платформы Windows 95, Win32 API телефонии и его поставщики услуг и компоненты поддержки полностью осуществлены как 32-разрядные компоненты в Win32. В дополнение к полному 32-разрядному выполнению, Win32 TAPI включает эти много новых особенностей:
ᄋ родная 32-разрядная поддержка. Все ядро TAPI компоненты - Win32, с полной поддержкой процессоров не Intel (выполняющийся Windows NT), симметрические многопроцессорные, многопоточные приложения, и приоритетная многозадачность.
ᄋ 32-разрядная прикладная мобильность. Существование Win32 полного TAPI и помогает приложениям TAPI, которые в настоящее время работают на Windows 95 (использующие TAPI 1.4 API) выполненный на Windows NT на Intel x86 семейство микропроцессоров без модификации или перетрансляции.
ᄋ 16-разрядная прикладная мобильность. Существование Win16 полного TAPI и помогает приложениям TAPI, которые в настоящее время работают на Windows 95 и операционной системе Windows - 3.1 (использующие TAPI 1.3 API) выполненный на Windows NT без модификации или перетрансляции.
ᄋ поддержка уникода. Win32 приложения может выбрать существующий ANSI-код функциями TAPI или вызывать версии юникода функций, которые передают или возвращают строки (функции с суффиксом "W").
ᄋ сервисные процессы. TAPI 2.0 добавляет механизмы для того, чтобы уведомить приложения событием телефонии, притом не требуется чтобы приложение имело окно, таким образом давая возможность фоновым сервисным процессам легко использовать TAPI услуги.
ᄋ NDISTAPI совместимость. Существующая поддержка в Windows NT 3.5 для минипортов глобальной сети цифровой сети комплексного обслуживания под Службой удаленного доступа сохраняется. NDIS драйверы минипорта глобальной сети поддерживаются при поставщике услуг привилегированного режима без модификации.
ᄋ поддержка системного реестра. Все параметры телефонии сохранены в системном реестре. Поставщики услуг телефонии и все сохраненные параметры могут быть модифицированы во время работы локальной сети.
ᄋ поддержка Центра Запроса. TAPI поддерживает функциональные возможности, требуемые в среде центра запроса, включая моделирование прогнозирующих портов набора номера и очередей, управления агента устройства автоматического распределения вызовов, управления состояния набора станции, и централизованной синхронизации случая.
ᄋ качество Обслуживания (QOS) Приложения могут запросить, договориться, и повторно договориться о качестве обслуживания, и получить индикацию относительно QOS на прибывающих запросах и когда QOS изменен сетью.
ᄋ расширенное совместное использование устройства. Приложения могут ограничить обработку прибывающих запросов на устройстве к отдельному адресу, поддерживать особенности типа звонящего и при использовании указать ожидаемый режим носителей прибывающих запросов. Приложения, делающие экспортные запросы могут установить конфигурацию устройства при создании запроса.
ᄋ компоненты непривилегированного режима. Полная TAPI система, включая поставщика услуг верхнего уровня DLLs, выполняется в непривилегированном режиме.
Телефония - технология, которая интегрирует компьютеры с телефонной сетью. С телефонией, люди могут использовать их компьютеры, чтобы использовать в своих интересах широкий диапазон сложных особенностей связи и услуг по телефонной линии.
Прикладной программный интерфейс телефонии (TAPI) позволяет программистам разрабатывать приложения, которые обеспечивают личную телефонию пользователям. TAPI поддерживает и речь и передачу данных, учитывает разнообразие конечных устройств, и поддерживает сложные типы подключения и методы управления запроса типа запросов конференции, режима отложенного звонка, и речевой почты.
1) Использование телефонии в приложениях
Возможности телефонии помогают людям получать большую выгоду от системы передачи данных, разрешая ей более эффективно управлять их запросами голоса и управлять их операциями передачи данных. Вы можете использовать TAPI, чтобы продемонстрировать эту эффективность любому менеджеру базы данных приложения, электронной таблице, приложению обработки текстов, посылая и получая данные через телефонную сеть.
TAPI дает вам непротиворечивый набор инструментальных средств для того, чтобы включить эти особенности в ваши приложения:
ᄋ соединяются непосредственно с телефонной сетью, а не полагаются на отдельное приложение связи
ᄋ номера телефона набираются автоматически
ᄋ передаются документы как файлы, факсы, или электронная почта
ᄋ данные доступа от поиска новостей и других информационных служб
ᄋ установка и управление запросами конференции
ᄋ получение, сохранение, и сортировка речевой почты
ᄋ идентификация вызывающей программы использования, чтобы автоматизировать обработку входящих запросов
ᄋ управление операциями удаленного компьютера
ᄋ совместная работа, используя телефонные линии
TAPI обеспечивает ваше приложение доступом к телефонной сети. Вы обеспечиваете ваших пользователей доступом к этим особенностям. Это означает, что вы выбираете и создаете интерфейс пользователя, который является совместимым с остальной частью вашего приложения. Вы выбираете интерфейс, и позволяете TAPI выполнять работу управления телефонными подключениями (связями).
2) Сетевые услуги
TAPI обеспечивает доступ к разнообразным телефонным сетевым услугам. Хотя эти услуги могут использовать различные технологии, чтобы установить запросы и передать голос и данные, TAPI делает их сервисно-определенными и прозрачными для приложений. Это означает, что Вы можете создать приложения, которые могут использовать в своих интересах любую доступную службу без включения сервисного определенного кода в вашем приложении.
Использование TAPI для обычной телефонной сети является прямым, потому что обычная телефонная сеть сравнительно проста. Обычно используется только один тип информации (типа данных или голоса) в запросе.
3) Компоненты Телефонии
Базируемая на Windows Открытая Архитектура Услуг (WOSA) модель, Windows Телефония состоит из TAPI и TAPI32 библиотек динамической связи (которые заставляют приложение, посылать запрос Службе Телефонии на обработку), TAPISRV.EXE (который осуществляет и управляет функциями TAPI) и одним или более поставщиками услуг телефонии (драйверы). TAPI обеспечивает не зависящий от устройства интерфейс для того, чтобы выполнить задачи телефонии. Поставщики услуг - библиотеки динамической связи, которые выполняют и возможно зависящие от устройств действия нижнего уровня.
Когда приложение вызывает функцию TAPI, TAPI динамически компонуемая библиотека проверяет правильность и генеральные параметры функции и передает управление TAPISRV.EXE. TAPISRV (Служба Телефонии) обрабатывает запрос и направляет запрос соответствующему поставщику услуг. Чтобы получать запросы от TAPISRV, поставщик услуг должен осуществить интерфейс драйвера службы Телефонии (TSPI). Поставщик услуг может обеспечить различные уровни интерфейса драйвера службы: основной, дополнительный, или расширенный (продленный). Например, простой поставщик услуг мог бы обеспечить основное обслуживание (службу) телефонии, типа поддержки запросам выхода, через Hayes-совместимый модем. Заказной поставщик услуг, написанный сторонним продавцом, мог бы обеспечить полный диапазон приходящей и уходящей поддержки запроса.
Приложения используют функции TAPI, чтобы определить, какие услуги являются доступными на данном компьютере. TAPI определяет, какие поставщики услуг являются доступными, и обеспечивает информацию об их возможностях к приложениям. Этим способом, любое приложение может запросить услуги от того же самого поставщика услуг; TAPI управляет всем доступом к поставщику услуг.
Для разработки алгоритма будем использовать компоненты TAPI 2.2 для Delphi7 (рис 9):
Рис 9
Опишем те компоненты, которые будем использовать в дипломном проекте, а также рассмотрим используемые события, свойства и методы их обработки.
Компоненты TAPILineService и TAPIPhoneService инкапсулируют различные функции соответствующей службы TAPI. Задачей этих сервисов является загружать TAPI.DLL и согласовывать соглашения версий.
Руководящие устройства (TAPILineDevice, TAPIPhoneDevice) - это абстракция аппаратных средств типа модема / ISDN карты или телефона.
Линии – TAPILine. Каждому руководящему устройству могут быть подчинены различные линии.
Объект TTapiCallParams помогает вам формировать необходимую структуру TAPI.
Адрес – TAPIAddress. Минимум один адрес подчинен каждой линии. TAPI отличает 2 различных адресных формата: выборный и AddressID.
Вызовы – TAPICall. Вызов представляет подключение (связь) по меньшей мере, двух адресов.
Таблица 3
Свойства компонент |
Пояснение |
TTapiLine.Active |
Это свойство активирует и дезактивирует прибор строки телефонии |
TTapiLine.MediaModes |
Это - набор разрядных флажков, которые указывают режимы носителей, которые используются, когда прибор строки TAPI активизирован, устанавливая TTapiLine |
TTapiLine.Privileges |
Это свойство используется, чтобы управлять привилегией, которую TTapiLine элемент хочет иметь к входящему, и исходящему запросу |
TTapiLine.Device |
Указывается компонент типа TAPILineDevice |
TTapiCallParams.BearerMode |
Этот свойство указывает режим, который используется, когда создан запрос. |
TTapiCallParams.AddressID |
Это свойство указывает адрес, который используется, когда создан запрос |
TTapiCallParams. CallParamsFlags |
Это - набор разрядных флажков, который использует LINECALLPARAMFLAGS_ константы |
TTapiCallParams.MediaMode |
Этот свойство указывает MediaMode, который используется, когда создан запрос |
TAPILineDevice. LineMapper |
Разрешает TAPI определить нужное устройство самостоятельно. |
TAPILineDevice.ID TAPIPhoneDevice.ID |
Идентификатор устройства подключенного к линии. |
TAPILineService.AppName TAPIPhoneService.AppName |
Это название приложение, которое посылало или первоначально принимало запрос или ответило на запрос. |
TAPICall.Info.CallerID |
Это свойство содержит информацию, которая идентифицирует возникающий адрес запроса. |
TAPIPhone.SpeakerHookSwitchMode |
Устанавливает режим работы общей связи |
TAPIPhone.SpeakerVolume |
Объем звуковых данных общей связи |
TAPIPhone.SpeakerGain |
Коэффициент усиления общей связи |
TAPIPhone.HeadSetHookSwitchMode |
Устанавливает режим работы наушников |
TAPIPhone.HandSetHookSwitchMode |
Устанавливает режим работы микрофона |
TAPIPhone.HeadSetVolume |
Объем звуковых данных наушников |
TAPIPhone.HeadSetGain |
Коэффициент усиления наушников |
TAPIPhone.HandSetVolume |
Объем звуковых данных микрофона |
TAPIPhone.HandSetGain |
Коэффициент усиления микрофона |
Таблица 4
Методы объектов |
Пояснение |
TAPIAddress1.OutboundCall.MakeCall |
Функция размещает запрос на строке |
TAPICall1.Drop TAPIAddress1.OutboundCall.Drop; |
Метод понижает или разъединяет точно установленный запрос. Запрос типично перемещается в неактивный запрос, и будет через некоторое время освобожден |
TAPIAddress1.InboundCall.Answer |
Метод отвечает на точно установленный запрос предложения. После того, как запросу успешно ответили, состояние запросов типично переходит на связанное состояние |
TAPICall1.DeallocateCall |
В TAPI больше ненужный (неактивный) запрос должен быть удален, чтобы освободить внутренние ресурсы. |
TAPIAddress1.InboundCall.Accept |
Функция принимает точно установленный предлагаемый запрос. И показывает что приложение примет контроль вызова. |
Таблица 5
События |
Пояснения |
TAPILineDevice. OnStateReMoved |
При удалении устройства из системы |
TAPILineDevice. OnStateRinging |
Событие вызывается тогда, когда “ИН” (Индикатор звонка) обнаружил активный сигнал в порту |
TAPICall. OnInfoCallerId |
CallerID информация появилась или изменилась |
TAPICall. OnReply |
При ответе устройства на запрос |
TAPICall. OnStateBusy |
При состоянии в линии – ‘занято’ |
TAPICall. OnStateConnected |
При состоянии соединения |
TAPICall. OnStateDisconnected |
При состоянии разъединения |
TAPICall. OnStateIdle |
События появляется если запрос находится в неактивном состоянии |
TAPICall. OnStateOffering |
Входящий запрос обнаружен на строке |
TAPICall. OnStateProceeding |
Появляется когда идет набор номера, и запрос продолжает проходить сквозь коммутатор или телефонную сеть. |
Обработка звуковых файлов в Windows
Наряду с базовой подсистемой файлового ввода/вывода, представленной функциями CreateFile, ReadFile, WriteFile и т.п., в Windows существует подсистема мультимедийного (звукового, видео и им подобного) файлового ввода/вывода MMIO (Multimedia Input/Output). Подсистема была введена еще в Windows 3.x, и позволяет удобно и эффективно работать со звуковыми и видеофайлами, а также упрощает работу с файлами, размещенными в оперативной памяти (memory files).
1) Файлы типа RIFF
Подсистема может оперировать с двоичными файлами любого типа, однако она содержит стандартные средства для работы с файлами типа RIFF (Resource Interchange File Format - формат файла обмена ресурсами). Фирмы Microsoft и IBM предложили этот формат в качестве универсального средства организации и хранения данных с иерархическо-последовательной структурой в системах Windows и OS/2.
Структуру RIFF имеют файлы типа WAV (поток оцифрованного звука), IDF (описатель MIDI–инструмента), AVI (поток оцифрованного изображения и звука), ANI (описатель "оживленного" (анимированного) курсора мыши), RMI (один из видов MIDI–партитуры) и многие другие. Creative Labs использует формат RIFF в файлах типа CSP (программы для специализированного звукового процессора ASP звуковых адаптеров Sound Blaster) и SBK/SF2 (загружаемых банков инструментов для звуковых адаптеров классов Sound Blaster AWE и Live!). Универсальный формат загружаемых банков инструментов DLS (DownLoadable Sounds), принятый в качестве стандарта ассоциацией производителей MIDI–систем (MMA - MIDI Manufacturers Association), построен на основе RIFF. Фирма Aureal применяет этот формат для построения загружаемых банков инструментов для своих звуковых чипов.
2) Разделы RIFF–файлов
Файлы типа RIFF состоят из разделов (chunk - кусок). Раздел содержит набор данных определенного типа. Большая часть разделов непосредственно представляет наборы данных, однако некоторые разделы содержат внутри себя подразделы (subchunks), которые представляют собственно поток данных, его параметры, формат и т.п. Охватывающий раздел в этом случае называется главным, или родительским (parent chunk).
3) Код FOURCC
Для обозначения типов разделов, а также в некоторых других целях, используется специальный код. Тип FOURCC (Four-Character Code - четырехсимвольный код) представляет собой двойное слово (DWORD), содержащее слово из 1..4 ASCII–символов - "RIFF", "wave", "fmt" и т.п. Слова короче четырех символов дополняются справа пробелами.
Порядок символов в двоичном представлении типа FOURCC тот же, что и в файле: первый символ представляется младшим байтом, а последний - старшим. Поэтому простое присваивание символьной константы (например, 'fmt ') даст обратное расположение байтов в двойном слове. Для корректного формирования значения можно использовать макросы MAKEFOURCC и mmioFOURCC.
Для кодов главных разделов определены константы FOURCC_RIFF и FOURCC_LIST.
4) Ключи мультимедийных файлов
Как и в случае обычных файлов Windows, для доступа к мультимедийному файлу используется его ключ - числовое значение, возвращаемое функцией mmioOpen. Фактически, ключ файла представляет собой указатель системного описателя файла, расположенного в памяти подсистемы MMIO.
Ключи обычных и мультимедийных файлов несовместимы между собой, однако уже открытый обычный файл можно повторно открыть в подсистеме MMIO, передав его ключ (типа HANDLE) функции mmioOpen.
5) Информационная структура файла
Для каждого открытого файла подсистема MMIO поддерживает информационную структуру, описывающую режимы работы с файлом и его параметры. Базовая информационная структура находится внутри самой подсистемы MMIO, приложение может поддерживать собственную локальную копию типа MMIOINFO в своей собственной области памяти.
6) Буферизация файлового обмена
Обмен информацией с файлом может быть непосредственным или буферизованным.
Непосредственный обмен подразумевает прямое чтение информации с диска и запись ее обратно на диск, и эффективен в том случае, когда обмен с файлом идет большими (несколько килобайт или больше) блоками данных, размеры которых кратны размеру сектора диска (обычно 512 байтов), и сами блоки начинаются также на границе сектора. При обмене мелкими (несколько десятков или сотен байтов), или некратными сектору блоками резко возрастают накладные расходы.
При буферизованном обмене между приложением и файлом находится так называемый буфер файла. При чтении из файла вначале неявно считывается полный буфер, а последующие функции чтения выбирают нужные порции данных из буфера, не обращаясь при этом к диску. При записи все работает наоборот: функции записи вначале заполняют буфер, а затем полностью записанный буфер неявно переносится в файл одной операцией записи.
Строго говоря, в MMIO даже непосредственный обмен с файлом включает простую скрытую буферизацию в самой подсистеме, так как минимальной единицей обмена данными с диском является сектор.
7) Процедуры обмена данными
Файловые функции MMIO на самом деле являются промежуточными. Весь фактический обмен с файлом выполняют так называемые процедуры обмена (I/O Procedures). Стандартные процедуры обмена обслуживают файлы на дисковых устройствах и в оперативной памяти; пользовательские процедуры могут обслуживать файлы на любом носителе, или даже полностью виртуальные файлы, не имеющие физического представления.
8) Структура звуковых файлов RIFF/WAVE
Файлы типа RIFF/WAVE служат для хранения оцифрованных звуковых потоков в различных звуковых форматах - PCM, ADPCM, a-Law, GSM, Audio MPEG и т.п. Стандартное расширение для файлов этого типа - WAV.
Минимальный состав WAVE–формы включает два подраздела: формата и данных. Раздел формата имеет код "fmt", и содержит описатель формата звуковых данных в виде расширенной структуры WAVEFORMATEX. Раздел данных состоит либо из одного подраздела "data", содержащего единый поток звуковых данных в цифровом виде, либо из подраздела-списка "wavl", содержащего последовательность из подразделов "data" и "slnt" (silent - тихий). Каждый подраздел "data" задает отдельный фрагмент звучания, подраздел "slnt" - фрагмент тишины (паузу) заданной длительности.
Для форматов, отличных от PCM, и в случае использования списка "wavl" после раздела "fmt" вставляется дополнительный раздел "fact". Первое двойное слово (DWORD) области данных раздела "fact" содержит общее количество звуковых отсчетов (samples) в файле. При помощи этого параметра можно определить время воспроизведения файла, поделив количество отсчетов на значение поля nSamplesPerSec в описателе формата, или вычислить объем, который поток займет после восстановления в PCM - умножив количество отсчетов на значение поля nBlockAlign в описателе выбранного для восстановления формата PCM.
В настоящее время область данных раздела "fact" включает только описанное поле, однако в будущем она может быть расширена добавлением дополнительных полей. Это необходимо иметь в виду, ориентируясь на размер области данных раздела, указанный в его заголовке. По размеру области данных можно узнать о наличии в разделе полей расширения.
В качестве необязательных элементов звукового файла перед разделом данных могут присутствовать разделы "cue" (список "флажков", или "закладок" внутри звукового потока - cue points), "plst" (порядок воспроизведения фрагментов - playlist), "adtl" (раздел типа "LIST", разная дополнительная информация о файле - associated data list) и т. п.
9) Структуры, используемые в MMIO
MMCKINFO - описатель раздела файла
Описывает раздел файла типа RIFF. Первые три поля структуры представляют собой заголовок раздела в том же виде, в котором он присутствует в файле; поле fccType присутствует только в заголовках главных разделов.
FOURCC ckid; DWORD cksize; FOURCC fccType; DWORD dwDataOffset; DWORD dwFlags; |
§ ckid - код (идентификатор) раздела.
§ cksize - размер области данных раздела в байтах. Поле отражает точный размер области данных; в него не входит размер заголовка и возможный дополнительный байт, автоматически дописываемый к области данных нечетного размера.
§ fccType - тип главного раздела, если в поле ckid указан код "RIFF" и "LIST".
§ dwDataOffset - смещение области данных раздела относительно начала файла. Значение этого поля удобно использовать в функции mmioSeek для позиционирования на начало области данных.
§ dwFlags - флаги состояния раздела.
MMIOINFO - информационная структура файла
Описывает состояние открытого файла, его буфера и процедуры обмена данными.
DWORD dwFlags; FOURCC fccIOProc; LPMMIOPROC pIOProc; UINT wErrorRet; HTASK hTask; LONG cchBuffer; HPSTR pchBuffer; HPSTR pchNext; HPSTR pchEndRead; HPSTR pchEndWrite; LONG lBufOffset; LONG lDiskOffset; DWORD adwInfo [4]; DWORD dwReserved1; DWORD dwReserved2; HMMIO hmmio; |
§ dwFlags - режимы открытия/опроса и флаги состояния файла, копируемые из параметра Mode функции mmioOpen.
§ fccIOProc - код установленной процедуры обмена. Если функция не является установленной - поле имеет нулевое значение. Для файлов универсальной структуры стандартная функция обмена имеет код "DOS".
§ pIOProc – указатель процедуры обмена. Если приложение не использует процедуру обмена, в этом поле находится указатель стандартной процедуры обмена файловой подсистемы.
§ wErrorRet – код ошибки, возвращаемый при неудачном завершении функции mmioOpen.
§ hTask – ключ задачи (task), созданной для процедуры обмена.
§ cchBuffer - размер буфера файла. Для файлов без буфера поле имеет нулевое значение.
§ pchBuffer - указатель буфера файла. Для файлов без буфера поле имеет нулевое значение.
§ pchNext - указатель текущей позиции в буфере.
§ pchEndRead - ограничитель чтения в буфере.
§ pchEndWrite - ограничитель записи в буфере.
§ lBufOffset - зарезервированное поле для служебного использования.
§ lDiskOffset - текущее смещение внутри файла. Поле управляется процедурами обмена.
§ adwInfo - дополнительная информация, используемая процедурами обмена. Используется также для передачи дополнительных данных при открытии файла.
§ dwReserved1, dwReserved2 - зарезервированные поля.
§ hmmio - ключ открытого файла.
10) Функции MMIO
Классы функций
Средства мультимедийной файловой подсистемы включают три основных класса функций:
- базовые - открытие, закрытие, чтение и запись файлов. Этот класс практически аналогичен стандартным средствам работы с файлами языка C.
- управления буферизацией - создание или установка промежуточного буфера и манипуляции с ним, а также - с текущей позицией буфера.
- работы с форматом RIFF - операции с файлами универсального формата RIFF.
Все функции интерфейса имеют имена с префиксом mmio. В заголовке описания каждой функции этот префикс опущен; полное имя каждой функции приведено в ее прототипе.
Перечень базовых функций :
Таблица 6
mmioStringToFOURCC |
Преобразование строки ASCIZ в код FOURCC |
mmioOpen |
Открытие или опрос файла |
mmioClose |
Закрытие файла |
mmioRename |
Переименование файла |
mmioRead |
Чтение из файла |
mmioWrite |
Запись в файл |
mmioSeek |
Позиционирование по файлу |
Перечень функций управления буферизацией:
Таблица 7
mmioGetInfo |
Запрос информационной структуры файла |
mmioSetInfo |
Модификация информационной структуры файла |
mmioSetBuffer |
Установка буфера для файла |
mmioAdvance |
Продвижение по файлу |
mmioFlush |
Принудительная запись буфера в файл |
Перечень функций работы с форматом RIFF:
Таблица 8
mmioCreateChunk |
Создание раздела |
mmioAscend |
Выход из раздела |
mmioDescend |
Вход в раздел |
Перечень остальных функций интерфейса:
Таблица 9
mmioSendMessage |
Посылка произвольного сообщения процедуре обмена |
mmioInstallIOProc |
Установка процедуры обмена |
IOProc |
Прототип процедуры обмена |
Возвращаемые значения
Для функций, возвращающих значения типа MMRESULT, а также для ряда других, определены константы кодов завершения с префиксами MMSYSERR_ и MMIOERR_.
Таблица 10
FILENOTFOUND |
Файл не найден |
OUTOFMEMORY |
Недостаточно памяти |
CANNOTOPEN |
Невозможно открыть файл |
CANNOTCLOSE |
Невозможно закрыть файл |
CANNOTREAD |
Невозможно прочитать из файла |
CANNOTWRITE |
Невозможно записать в файл |
CANNOTSEEK |
Невозможно позиционировать файл |
CANNOTEXPAND |
Невозможно расширить файл |
CHUNKNOTFOUND |
Раздел не найден |
UNBUFFERED |
Файл открыт для непосредственного доступа |
PATHNOTFOUND |
Недопустимый путь (устройство и/или каталог) |
ACCESSDENIED |
Доступ к файлу запрещен |
SHARINGVIOLATION |
Нарушение условий совместного доступа |
NETWORKERROR |
Ошибка сетевой подсистемы |
TOOMANYOPENFILES |
Нет свободных описателей ключей для нового файла |
INVALIDFILE |
Общая ошибка, неудача по неизвестной причине |
Подсистема сжатия звука в Windows
1) Драйверы, преобразователи, кодеки, фильтры
В ACM существует два вида обработки звука:
- Преобразование формата - изменение способа представления звуковых данных, перекодировка их из одного представления в другое без изменения общих свойств самого звука.
- Фильтрование - обработка звука в потоке (усиление/ослабление, изменение АЧХ, наложение звуковых эффектов и т.п.) без изменения формата.
Модули драйверов ACM, реализующие функции преобразования форматов, называют преобразователями формата (format convertors). Модули, реализующие функции фильтрования, называются фильтрами (filters). Один и тот же подключаемый драйвер может совмещать в себе различные функции, а также - содержать более одного преобразователя или фильтра.
Преобразование форматов, при котором меняется тип (tag) формата, обычно сопровождается изменением объема звуковых данных. Такие виды преобразования называются сжатием (compression) или восстановлением (decompression). Сжатию обычно подвергаются данные в формате PCM, а при восстановлении формат PCM обычно имеет результат операции. Преобразователи формата, реализующие сжатие/восстановление, называются кодеками (codec - coder/decoder или compressor/decompressor).
2) Аппаратная поддержка драйверов
Большинство драйверов ACM являются программными - они используют для своей работы только ресурсы центрального процессора, и не нуждаются в каких-либо дополнительных аппаратных средствах. Для успешной работы программного драйвера необходим лишь достаточно мощный центральный процессор и необходимое количество основной памяти.
При наличии в системе DSP (Digital Signal Processor - цифровой сигнальный процессор), который может обрабатывать звук практически без участия центрального процессора, для него может быть разработан драйвер ACM, выполняющий обработку звука средствами этого DSP. Сам DSP при этом может быть, как встроен в системную плату, так и находиться на одной из плат расширения. В этом случае говорят, что драйвер ACM имеет аппаратную поддержку.
Некоторые звуковые устройства поддерживают аппаратное преобразование форматов в реальном времени при вводе/выводе звука - например, они могут выдавать записываемый звук сразу в формате ADPCM, сжимая его "на ходу" при помощи встроенного DSP. Несмотря на то, что такие устройства бесполезны для полнофункционального драйвера ACM и полностью поддерживаются базовой звуковой подсистемой MME/Wave, ACM предоставляет некоторые удобства в отношении и таких устройств. ACM содержит средства поиска и выбора форматов по различным критериям, и одним из таких критериев является аппаратная поддержка формата одним из звуковых адаптеров - при вводе и/или при выводе.
Поскольку формально подсистемы MME/Wave и ACM никак не связаны между собой, для определения аппаратно поддерживаемых форматов такой звуковой адаптер должен быть снабжен упрощенным драйвером ACM, который и будет выделять поддерживаемые адаптером форматы из общего списка, а также - возвращать приложению идентификатор звукового устройства, к которому следует обратиться. А если звуковой адаптер поддерживает обработку звука независимо от его записи/воспроизведения - драйвер ACM может быть и полнофункциональным. В последнем случае ресурсы аппаратуры разделяются между подсистемами MME/Wave и ACM.
3) Синхронные и асинхронные драйверы
Как и драйверы звуковых адаптеров, драйверы ACM также могут быть синхронными и асинхронными. Практически все программные драйверы являются синхронными; драйверы с аппаратной поддержкой обычно делаются асинхронными. Для асинхронных драйверов предусмотрена очередь входных заданий и механизм уведомления приложения о завершении ранее запрошенных операций; синхронные драйверы не возвращают приложению управления до тех пор, пока не будет завершена запрошенная операция.
4) Уведомление приложений о выполнении операций
Для уведомления об изменении приоритетов и состояний драйверов заданному окну приложения посылается заданное сообщение Windows. Окно и сообщение задаются подобно установке нового драйвера - функцией acmDriverAdd. Окно, получающее такие сообщения, называется окном уведомления (notification window).
5) Типы фильтров и форматов
Основной характеристикой фильтра или формата является его тип - способ обработки данных в фильтре (эхо, усиление/ослабление) или способ представления данных в формате (PCM, ADPCM, MPEG и т.п.).
Конкретные форматы и фильтры внутри каждого типа отличаются только параметрами: частотой дискретизации, разрядностью отсчета, тонкостями кодирования - для форматов, степенью усиления/ослабления сигнала, величиной задержки - для фильтров. Основные характеристики - способ представления и вид обработки - в пределах одного типа остаются неизменными.
Каждому типу фильтров и форматов присвоен свой уникальный код (tag), который однозначно идентифицирует его в подсистеме сжатия. Коды типов имеют неизменные числовые значения и для обеспечения уникальности должны быть зарегистрированы в Microsoft. Наряду с кодами типов ACM использует также индексы (внутренние номера) типов фильтров/форматов, поддерживаемых каждым из драйверов. Индексы не имеют ничего общего с кодами и отражают лишь порядковые номера фильтров/форматов различного типа в служебных списках драйвера. При помощи индексов удобно последовательно перебирать все типы фильтров/форматов, поддерживаемые заданным драйвером.
6) Порции и буферы преобразуемых данных
Преобразование данных в ACM производится порциями. Порция потока преобразования обычно имеет размер от нескольких десятков байт до нескольких сотен килобайт, в зависимости от структуры звукового формата и динамики преобразования. За каждую операцию преобразования обрабатывается одна порция данных.
Для каждого потока преобразования создаются два буфера: входной - для порции исходных данных, и выходной - для порции данных результата. Размер преобразуемой порции не может превышать выбранного размера буфера.
7) Потоки преобразования
Как и основная звуковая подсистема MME/Wave, ACM обрабатывает звуковые данные потоками. Это означает, что приложение не может обрабатывать звуковые данные в произвольной последовательности, а только последовательно, от начала к концу потока. Такое ограничение связано с тем, что как преобразование форматов, так и фильтрование может потребовать информации о предшествовании - например, относительное кодирование амплитуд в формате ADPCM или формирование эффекта эха в фильтре Echo. Поэтому обработка звукового потока в ACM включает в себя три стадии:
- Создание, или открывание потока (acmStreamOpen). При этом приложение сообщает ACM параметры потока - форматы, режимы обработки, способы уведомления - и получает от ACM ключ открытого потока.
- Обработка потока (acmStreamConvert). На этом этапе приложение последовательно передает ACM буферы обмена, содержащие порции преобразуемых звуковых данных. ACM передает буферы выбранному драйверу для обработки, а после завершения обработки каждый буфер возвращается приложению. Обработка потока может происходить в реальном времени, если аппаратура компьютера успевает выполнять ее достаточно быстро.
- Уничтожение, или закрывание потока (acmStreamClose). Последняя операция с потоком, после которой поток перестает существовать.
Поток преобразования ACM фактически состоит из двух звуковых потоков - исходного (source) и результирующего (destination). Данные исходного потока существуют до начала обработки и не изменяются после ее завершения; данные результирующего потока создаются в процессе обработки.
8) Ключи объектов
Как и в остальных подсистемах Windows, объекты ACM, с которыми работает приложение, идентифицируются специальными ключами, которые ACM возвращает приложению в ответ на запрос доступа к объекту. В ACM имеется три вида объектов:
- идентификатор драйвера (driver id). Используется для указания установленного драйвера в ACM, например - при запросе параметров драйвера. Каких-либо специальных операций перед использованием идентификатора не требуется.
- выбранный для работы драйвер (driver). Возвращается ACM при открывании драйвера, и используется для ссылок к подмножеству открытых для работы драйверов.
- поток (stream). Возвращается ACM при открывании потока и используется для операций с потоком.
Каждый из объектов имеет свой тип ключа - HACMDRIVERID, HACMDRIVER, HACMSTREAM. Кроме этого, имеется универсальный тип HACMOBJ, предназначенный для использования в функциях, работающих с объектами различного типа.
9) Типы и структуры, используемые в ACM
Большинство структур имеет в своем составе поле cbStruct, в которое приложение должно занести размер области памяти, где размещена структура. Интерфейсные функции используют это поле двояким образом: когда информация из структуры является исходной - поле показывает, какой ее объем реально присутствует в указанной области памяти; когда функция заполняет поля структуры возвращаемой информацией - поле cbStruct ограничивает размер заполняемой области. В зависимости от выбранной функции и режимов ее работы существуют различные ограничения на размер области памяти: она может включать либо только часть полей описанной структуры, либо всю структуру целиком, либо иметь резервную область непосредственно за концом структуры. В последнем случае резервная область может использоваться для дополнительных данных, не вошедших в основные поля описанной структуры.
Когда ACM заполняет структуру, содержащую поле cbStruct, в него заносится реальный размер возвращенной информации. Если какие-то поля структуры являются необязательными, приложение может определить, какая часть структуры была заполнена ACM.
При обращении к ACM вместе со структурой часто передается сопровождающий набор флагов, показывающих, какие из полей структуры несут осмысленную информацию. Несмотря на то, что такие поля анализируются лишь при наличии соответствующих флагов, многие функции являются "привередливыми" и требуют, чтобы неиспользуемые входные поля имели нулевые значения. Чтобы гарантировать успешную работу функций, необходимо перед обращением к ним либо обнулить все неиспользуемые входные поля, либо обнулить всю структуру до заполнения ее полей осмысленной информацией.
Структура WAVEFORMATEX
WORD wFormatTag ;
WORD nChannels ;
DWORD nSamplesPerSec ;
DWORD nAvgBytesPerSec ;
WORD nBlockAlign ;
WORD wBitsPerSample ;
WORD cbSize ;
· wFormatTag - формат Waveform audio.
· nChannels - количество каналов. Обычно 1 (моно) или 2(стерео);
· nSamplesPerSec - частота дискретизации. Для формата PCM - в классическом смысле, т.е. количество выборок в секунду. Согласно теореме отсчетов должна вдвое превышать частоту оцифровываемого сигнала. Обычно находится в диапазоне от 8000 до 44100 выборок в секунду;
· nAvgBytesPerSec - средняя скорость передачи данных. Для PCM равна nSamplesPerSec*nBlockAlign;
· nBlockAlign - размер блока данных, для PCM равен (nChannels*wBitsPerSample)/8;
· wBitsPerSample - количество бит в одной выборке. Для PCM равно 8 или 16;
· cbSize – подсчет размера в байтах
Структура WAVEFILTER
Полностью описывает параметры фильтра.
DWORD cbStruct; DWORD dwFilterTag; DWORD fdwFilter; DWORD dwReserved [5]; |
§ cbStruct - размер области памяти, занимаемой структурой.
§ dwFilterTag - код типа фильтра.
§ fdwFilter - флаги параметров и режимов работы фильтра. На данный момент пока не определено флагов для этого поля.
§ dwReserved - служебные поля ACM и драйвера.
Структура ACMDRIVERDETAILS
Описывает параметры и свойства драйвера ACM. Кроме cbStruct, поля структуры заполняются ACM.
DWORD cbStruct; FOURCC fccType; FOURCC fccComp; WORD wMid; WORD wPid; DWORD vdwACM; DWORD vdwDriver; DWORD fdwSupport; DWORD cFormatTags; DWORD cFilterTags; HICON hicon; char szShortName [ACMDRIVERDETAILS_SHORTNAME_CHARS]; char szLongName [ACMDRIVERDETAILS_LONGNAME_CHARS]; char szCopyright [ACMDRIVERDETAILS_COPYRIGHT_CHARS]; char szLicensing [ACMDRIVERDETAILS_LICENSING_CHARS]; char szFeatures [ACMDRIVERDETAILS_FEATURES_CHARS]; |
§ cbStruct - размер области памяти, занимаемой структурой.
§ fccType - тип драйвера в формате FOURCC. Для драйверов ACM это поле имеет значение ACMDRIVERDETAILS_FCCTYPE_AUDIOCODEC (строка "audc").
§ fccComp - подтип драйвера в формате FOURCC. Это поле обычно имеет значение ACMDRIVERDETAILS_FCCCOMP_UNDEFINED (нуль).
§ wMid, wPid - идентификаторы производителя (Manufacturer) и продукта (Product). Константы, представляющие коды известных производителей и продуктов, определены в файле MMREG.H.
§ vdwACM, vdwDriver - версии службы ACM, для которой создан драйвер, и самого драйвера.
§ fdwSupport - флаги поддерживаемых драйвером возможностей и режимов. cFormatTags - количество различных типов форматов (способов представления данных), поддерживаемых драйвером.
§ cFilterTags - количество различных типов фильтров (способов обработки звука), поддерживаемых драйвером.
§ hicon - ключ иконки (пиктограммы) драйвера, либо NULL при отсутствии пиктограммы.
§ szShortName - короткое (сокращенное) название драйвера.
§ szLongName - длинное (полное) название драйвера.
§ szCopyright - строка информации об авторских правах.
§ szLicensing - строка информации об условиях использования драйвера.
§ szFeatures - строка информации о возможностях драйвера.
Структуры ACMFILTERTAGDETAILS / ACMFORMATTAGDETAILS
Описывают параметры типа фильтров/форматов, и различаются только именами полей. Поля структур заполняются ACM, если не оговорено иначе.
Структура ACMFILTERTAGDETAILS:
DWORD cbStruct; DWORD dwFilterTagIndex; DWORD dwFilterTag; DWORD cbFilterSize; DWORD fdwSupport; DWORD cStandardFilters; char szFilterTag [ACMFILTERTAGDETAILS_FILTERTAG_CHARS]; |
Структура ACMFFORMATTAGDETAILS:
DWORD cbStruct; DWORD dwFormatTagIndex; DWORD dwFormatTag; DWORD cbFormatSize; DWORD fdwSupport; DWORD cStandardFormats; char szFormatTag [ACMFORMATTAGDETAILS_FORMATTAG_CHARS]; |
§ cbStruct - размер области памяти, занимаемой структурой.
§ dwFilterTagIndex / dwFormatTagIndex - индекс (внутренний номер) данного типа внутри драйвера. Кроме случаев запроса описания по индексу поле должно быть нулевым; ACM всегда возвращает в этом поле нулевое значение.
§ dwFilterTag / dwFormatTag - уникальный код типа. Устанавливается приложением для тех случаев, когда запрос делается по коду типа. После успешного выполнения запроса всегда устанавливается ACM.
§ cbFilterSize / cbFormatSize - размер области памяти, достаточный для размещения расширенной структуры WAVEFILTER / WAVEFORMATEX, описывающей любой из фильтров/форматов данного типа.
§ fdwSupport - флаги поддерживаемых возможностей и режимов драйвера этого типа фильтров/форматов.
§ cStandardFilters / cStandardFormats - количество стандартных фильтров/форматов данного типа, поддерживаемых драйвером.
§ szFilterTag / szFormatTag - текстовое название типа.
Структуры ACMFILTERDETAILS / ACMFORMATDETAILS
Описывают параметры конкретного фильтра/формата, и различаются только именами полей:
Структура ACMFILTERDETAILS:
DWORD cbStruct; DWORD dwFilterIndex; DWORD dwFilterTag; DWORD fdwSupport; LPWAVEFILTER pwfltr; DWORD cbwfltr; char szFilter [ACMFILTERDETAILS_FILTER_CHARS]; |
Структура ACMFORMATDETAILS:
DWORD cbStruct; DWORD dwFormatIndex; DWORD dwFormatTag; DWORD fdwSupport; LPWAVEFORMATEX pwfx; DWORD cbwfx; char szFormat [ACMFORMATDETAILS_FORMAT_CHARS]; |
§ cbStruct - размер области памяти, занимаемой структурой.
§ dwFilterIndex / dwFormatIndex - индекс (внутренний номер) стандартного фильтра/формата внутри драйвера. В отличие от индексов типов, индексы стандартных фильтров/форматов однозначно определяют конкретные стандартные фильтры и форматы в пределах хотя бы одной версии драйвера. Кроме случаев запроса описания по индексу поле должно быть нулевым; ACM всегда возвращает в этом поле нулевое значение.
§ dwFilterTag / dwFormatTag - код типа, которому принадлежит фильтр/формат. Устанавливается приложением для тех случаев, когда запрос делается по коду типа. После успешного выполнения запроса всегда устанавливается ACM.
§ fdwSupport - флаги поддерживаемых возможностей и режимов драйвера этого типа форматов.
§ pwfltr / pwfx - указатель структуры WAVEFILTER / WAVEFORMATEX, которую при запросе описания фильтра/формата ACM заполняет его параметрами.
§ cbwfltr / cbwfx - размер области памяти, в которой размещена структура WAVEFILTER / WAVEFORMATEX.
§ szFilter / szFormat - текстовое название стандартного фильтра/формата внутри его типа. Вместе с полем szFilterTag / szFormatTag структуры ACMFILTERTAGDETAILS / ACMFORMATTAGDETAILS образует уникальное текстовое название фильтра/формата внутри всей подсистемы ACM.
Структуры ACMFILTERCHOOSE и ACMFORMATCHOOSE
Эти две очень похожие структуры описывают наборы данных, необходимые для вывода пользователю диалога, содержащего меню всех доступных или подходящих стандартных фильтров/форматов. Используются функциями acmFilterChoose и acmFormatChoose.
Структура ACMFILTERCHOOSE:
DWORD cbStruct; DWORD fdwStyle; HWND hwndOwner; LPWAVEFILTER pwfltr; DWORD cbwfltr; LPCSTR pszTitle; char szFilterTag [ACMFILTERTAGDETAILS_FILTERTAG_CHARS]; char szFilter [ACMFILTERDETAILS_FILTER_CHARS]; LPSTR pszName; DWORD cchName; DWORD fdwEnum; LPWAVEFILTER pwfltrEnum; HINSTANCE hInstance; LPCSTR pszTemplateName; LPARAM lCustData; ACMFILTERCHOOSEHOOKPROC pfnHook; |
Структура ACMFORMATCHOOSE:
DWORD cbStruct; DWORD fdwStyle; HWND hwndOwner; LPWAVEFORMATEX pwfx; DWORD cbwfx; LPCSTR pszTitle; char szFormatTag [ACMFORMATTAGDETAILS_FORMATTAG_CHARS]; char szFormat [ACMFORMATDETAILS_FORMAT_CHARS]; LPSTR pszName; DWORD cchName; DWORD fdwEnum; LPWAVEFORMATEX pwfxEnum; HINSTANCE hInstance; LPCSTR pszTemplateName; LPARAM lCustData; ACMFORMATCHOOSEHOOKPROC pfnHook; |
§ cbStruct - размер области памяти, занимаемой структурой.
§ fdwStyle - флаги стилей построения диалога. Имена констант флагов выбора фильтра имеют префикс ACMFILTERCHOOSE_STYLEF_, имена констант флагов выбора формата - ACMFORMATCHOOSE_STYLEF_:
Таблица 11
CONTEXTHELP |
В диалоге будет доступна контекстно-зависимая помощь. При запросе пользователем помощи ACM будет посылать окну-владельцу сообщения с кодами ACMHELPMSGCONTEXTMENU и ACMHELPMSGCONTEXTHELP, параметры wParam и lParam которых будут скопированы из исходных сообщений WM_CONTEXTMENU или WM_CONTEXTHELP. Коды сообщений ACM предварительно должны быть зарегистрированы в Windows посредством функции RegisterWindowMessage. |
ENABLEHOOK |
Разрешает использование функции перехвата сообщений Windows, заданной полем pfnHook. |
ENABLETEMPLATE |
Диалог будет создан из шаблона (template), описываемого полями hInstance и pszTemplateName. |
ENABLETEMPLATEHANDLE |
Поле hInstance содержит ключ уже загруженного в память шаблона диалога. В этом случае поле pszTemplateName игнорируется. |
INITTOFILTERSTRUCTINITTOWFXSTRUCT |
Начальные значения для типа и стандартного фильтра/формата в диалоге будут выбраны на основе описателя, указатель которого задан полем pwfltr / pwfx. В этом случае поле pwfltr/pwfx должно ссылаться на правильно заполненную структуру типа WAVEFILTER / WAVEFORMATEX. |
SHOWHELP |
Диалог будет снабжен кнопкой запроса помощи (Help), при нажатии которой окну-владельцу будет посылаться сообщение ACM с кодом ACMHELPMSGSTRING. Это сообщение необходимо предварительно зарегистрировать в Windows посредством функции RegisterWindowMessage. |
§ hwndOwner - ключ окна-владельца (owner window) создаваемого диалога. Может быть нулевым, если окно-владелец не требуется.
§ pwfltr / pwfx - указатель области памяти для структуры типа WAVEFILTER / WAVEFORMATEX, в которую заносится описание выбранного фильтра/формата при успешном завершении выбора. Из этой же структуры берутся начальные значения полей диалога, если присутствует соответствующий флаг стиля.
§ cbwfltr / cbwfx - размер области памяти для структуры описания фильтра/формата. Если указанного размера недостаточно для записи требуемой структуры - ACM возвращает код ошибки NOTPOSSIBLE, одновременно занося в это поле требуемый размер области.
§ pszTitle - указатель строки заголовка диалога. Если это поле имеет нулевое значение - ACM использует заголовок по умолчанию.
§ szFilterTag / szFormatTag - область для строки названия типа фильтров/форматов. При успешном завершении выбора ACM заносит в это поле название выбранного типа.
§ szFilter / szFormat - область для строки названия стандартного фильтра/формата. При успешном завершении выбора ACM заносит в это поле название выбранного стандартного фильтра или формата.
§ pszName - указатель строки названия пресета для фильтра/формата. Если поля pszName и cchName описывают корректную символьную строку, и флагами стилей не задана установка начальных значений, ACM пытается найти соответствующий пресет и установить по нему начальные значения списков диалога. Поиск пресетов происходит путем посимвольного сравнения строк с игнорированием регистра. После успешного завершения выбора, если поля pszName и cchName описывают буфер достаточного размера, ACM заносит в него название выбранного пресета. Если выбранный фильтр/формат не имеет пресета (Untitled) - в буфер заносится пустая строка.
§ cchName - размер буфера, указываемого полем pszName, в байтах. Если pszName равно нулю, значение этого поля игнорируется.
§ fdwEnum - флаги режимов перебора фильтров/форматов. Вместе с полем pwfltrEnum / pwfxEnum задают условия, которым должны удовлетворять фильтры/форматы, включаемые в списки выводимого диалога. Поскольку для построения списков ACM пользуется собственными же функциями перебора, в этом поле используются те же флаги, что и в функциях acmFilterEnum / acmFormatEnum. Если поле pwfltrEnum / pwfxEnum имеет нулевое значение, поле флагов перебора тоже должно быть нулевым.
§ pwfltrEnum / pwfxEnum - указатель описателя фильтра/формата - структуры типа WAVEFILTER / WAVEFORMATEX, отдельные поля которой, либо вся структура целиком, задают условия для отбора фильтров/форматов, включаемых в списки выводимого диалога.
§ hInstance - ключ области данных, содержащей шаблон для создания диалога. Имя ресурса задается полем pszTemplateName. Поле используется только при наличии в стиле диалога флагов ENABLETEMPLATE или ENABLETEMPLATEHANDLE; в противном случае значение поля должно быть нулевым.
§ pszTemplateName - имя ресурса, содержащего шаблон для создания диалога. Для нумерованных ресурсов может использоваться стандартный макрос Windows MAKEINTRESOURCE. Поле используется только при наличии среди в стиле диалога флага ENABLETEMPLATE; в противном случае значение поля должно быть нулевым.
§ lCustData - произвольное значение, определяемое приложением, которое будет передаваться в функцию перехвата сообщений - в параметре lParam сообщения WM_INITDIALOG.
§ pfnHook - указатель функции перехвата, которая будет получать сообщения Windows, адресованные диалогу выбора.
Структура ACMSTREAMHEADER
Описывает фрагмент преобразуемого звукового потока и называется заголовком потока.
DWORD cbStruct; DWORD fdwStatus; DWORD dwUser; LPBYTE pbSrc; DWORD cbSrcLength; DWORD cbSrcLengthUsed; DWORD dwSrcUser; LPBYTE pbDst; DWORD cbDstLength; DWORD cbDstLengthUsed; DWORD dwDstUser; DWORD dwReservedDriver [10]; |
§ cbStruct - размер области памяти, занимаемой структурой.
§ fdwStatus - флаги состояния буфера. Устанавливаются приложением в нуль, далее управляются ACM. Имена констант имеют префикс ACMSTREAMHEADER_STATUSF_:
Таблица 12
DONE |
Преобразование завершено. |
INQUEUE |
Заголовок находится в очереди драйвера. |
PREPARED |
Заголовок подготовлен для передачи драйверу. |
§ dwUser - вспомогательное информационное значение, общее для обоих потоков, передаваемое обратно в приложение при уведомлении. Устанавливается приложением.
§ pbSrc - указатель буфера, содержащего порцию данных исходного звукового потока. Устанавливается приложением.
§ cbSrcLength - размер порции данных в буфере исходного потока (в байтах). Устанавливается приложением.
§ cbSrcLengthUsed - количество байтов порции данных исходного потока, использованных в последней операции преобразования. Устанавливается драйвером.
§ dwSrcUser - вспомогательное информационное значение для исходного потока, передаваемое обратно в приложение при уведомлении. Устанавливается приложением.
§ pbDst - указатель буфера для порции данных результирующего звукового потока. Устанавливается приложением.
§ cbDstLength - размер буфера выходного потока (в байтах). Устанавливается приложением.
§ cbDstLengthUsed - размер порции данных, записанных в буфер результирующего потока последней операцией преобразования. Устанавливается драйвером.
§ dwDstUser - вспомогательное информационное значение для результирующего потока, передаваемое обратно в приложение при уведомлении. Устанавливается приложением.
§ dwReservedDriver - служебные поля для ACM и драйвера.
10) Функции ACM
Классы функций интерфейса ACM
ACM имеет в своем составе четыре основных класса интерфейсных функций. Принадлежность функции к определенному классу обозначается префиксом в ее имени:
- Функции работы с драйверами (acmDriver). Служат для установки, удаления, настройки, опроса и перебора доступных драйверов ACM.
- Функции работы с фильтрами (acmFilter). Служат для опроса, перебора и выбора доступных фильтров.
- Функции работы с форматами (acmFormat). Служат для опроса, перебора и выбора доступных форматов (кодеков).
- Функции работы с потоками (acmStream). Служат для создания потоков преобразования и обработки порций данных в них.
Кроме этого, ACM сам может вызывать (callback) три типа функций приложения:
- Функции поддержки перебора - вызываются в процессе перебора (enumeration) драйверов, типов форматов/фильтров, или стандартных форматов/фильтров, и служат для формирования списка перебираемых объектов или остановки процесса перебора при нахождении нужного объекта.
- Функции перехвата - вызываются при поступлении сообщений Windows в стандартные диалоги ACM, выводимые пользователю функциями выбора фильтра или формата, и служат для перехвата (hook) этих сообщений до обработки их средствами ACM. Позволяют изменить принятое по умолчанию поведение стандартных диалогов ACM.
- Функции уведомления - вызываются после завершения запрошенной операции. Уведомление также может происходить в виде установки объекта события (event) либо посылки сообщения - задаче (thread) или окну.
Информационные функции
Таблица 13
acmGetVersion |
Запрос версии ACM |
acmMetrics |
Запрос различных параметров ACM |
Функции работы с драйверами
Таблица 14
acmDriverAdd |
Установка собственного драйвера приложения или задание окна уведомления |
acmDriverRemove |
Удаление собственного драйвера приложения |
acmDriverOpen |
Открывание драйвера |
acmDriverClose |
Закрывание драйвера |
acmDriverDetails |
Запрос сведений о драйвере |
acmDriverEnum |
Перебор доступных драйверов |
acmDriverID |
Запрос идентификатора драйвера |
acmDriverPriority |
Установка приоритета драйвера |
acmDriverMessage |
Передача сообщения драйверу |
Функции работы с фильтрами
Таблица 15
acmFilterTagDetails |
Запрос сведений о типе фильтра |
acmFilterDetails |
Запрос сведений о фильтре |
acmFilterTagEnum |
Перебор доступных типов фильтров |
acmFilterEnum |
Перебор доступных стандартных фильтров |
acmFilterChoose |
Выбор фильтра при помощи стандартного диалога ACM |
Функции работы с форматами
Таблица 16
acmFormatTagDetails |
Запрос сведений о типе формата |
acmFormatDetails |
Запрос сведений о формате |
acmFormatTagEnum |
Перебор доступных типов форматов |
acmFormatEnum |
Перебор доступных стандартных форматов |
acmFormatChoose |
Выбор формата при помощи стандартного диалога ACM |
acmFormatSuggest |
Запрос наиболее подходящего для преобразования формата |
Функции работы с потоками
Таблица 17
acmStreamOpen |
Открывание потока преобразования |
acmStreamClose |
Закрывание потока |
acmStreamSize |
Запрос размеров буферов потока |
acmStreamPrepareHeader |
Подготовка буфера потока |
acmStreamUnprepareHeader |
Отмена подготовки буфера потока |
acmStreamConvert |
Преобразование очередной порции данных в потоке |
acmStreamReset |
Сброс (уничтожение) потока |
acmStreamMessage |
Передача сообщения драйверу потока |
Функции, определяемые приложением
В отличие от стандартных функций интерфейса, все функции этой группы определяются приложением. Имена, приведенные в таблице, являются условными, реальные функции приложения могут иметь любые имена. Приложение передает эти функции ACM при помощи указателей, а ACM вызывает их в заранее оговоренных случаях.
Таблица 18
DriverProc |
Основная функция драйвера |
ChooseHook |
Перехват сообщений диалога выбора фильтра/формата |
DriverEnumCallback |
Поддержка перебора драйверов |
FilterTagEnumCallback |
Поддержка перебора типов фильтров |
FilterEnumCallback |
Поддержка перебора стандартных фильтров |
FormatTagEnumCallback |
Поддержка перебора типов форматов |
FormatEnumCallback |
Поддержка перебора стандартных форматов |
StreamCallback |
Уведомление о завершении операции с потоком |
Возвращаемые значения
Большинство функций ACM возвращает значения типа MMRESULT - универсальный код результата звуковой подсистемы Windows. В дополнение к стандартным кодам, константы для которых имеют префикс MMSYSERR_, для ACM определены константы с префиксами ACMERR_:
Таблица 19
NOTPOSSIBLE |
Невозможно выполнить запрошенную операцию. Обычно эта ошибка возникает при невозможности использовать требуемое сочетание форматов, или когда объема заданного буфера недостаточно для записи всех затребованных данных. |
BUSY |
Запрошенный драйвер в настоящее время используется, попытка закрыть поток с незавершенной асинхронной операцией, и т.п. |
UNPREPARED |
Буфер преобразования не был подготовлен функцией acmStreamPrepareHeader. |
CANCELED |
Пользователь закрыл кнопкой Cancel диалог, выведенный функцией выбора фильтра/формата. |
3.5 Работа с базами данных в DELPHI
В нашем проекте используется база данных (Paradox), поэтому рассмотрим основы баз данных. Под базой данных понимается некоторая унифицированная совокупность данных, совместно используемая персоналом/населением группы, предприятия, региона, страны, мира... Задача базы данных состоит в хранении всех представляющих интерес данных в одном или нескольких местах, причем таким способом, который заведомо исключает ненужную избыточность. В хорошо спроектированной базе данных избыточность данных исключается, и вероятность сохранения противоречивых данных минимизируется. Таким образом, создание баз данных преследует две основные цели: понизить избыточность данных и повысить их надежность.
В этом дипломном проекте используется одна из реляционных баз данных так как: во-первых, реляционные базы получили наибольшее распространение в мире; во-вторых, они наиболее “продвинуты” в научном плане; а в-третьих, ядро баз данных Borland Database Engine, на основе которого работают все последние продукты компании Borland, предназначено именно для работы с реляционными базами данных.
Жизненный цикл любого программного продукта, в том числе и системы управления базой данных, состоит (по-крупному) из стадий проектирования, реализации и эксплуатации.
Естественно, наиболее значительным фактором в жизненном цикле приложения, работающего с базой данных, является стадия проектирования. От того, насколько тщательно продумана структура базы, насколько четко определены связи между ее элементами, зависит производительность системы и ее информационная насыщенность, а значит - и время ее жизни.
Требования к базам данных
Итак, хорошо спроектированная база данных:
* Удовлетворяет всем требованиям пользователей к содержимому базы данных. Перед проектированием базы необходимо провести обширные исследования требований пользователей к функционированию базы данных.
* Гарантирует непротиворечивость и целостность данных. При проектировании таблиц нужно определить их атрибуты и некоторые правила, ограничивающие возможность ввода пользователем неверных значений. Для верификации данных перед непосредственной записью их в таблицу база данных должна осуществлять вызов правил модели данных и тем самым гарантировать сохранение целостности информации.
* Обеспечивает естественное, легкое для восприятия структурирование информации. Качественное построение базы позволяет делать запросы к базе более “прозрачными” и легкими для понимания; следовательно, снижается вероятность внесения некорректных данных и улучшается качество сопровождения базы.
Удовлетворяет требованиям пользователей к производительности базы данных. При больших объемах информации вопросы сохранения производительности начинают играть главную роль, сразу “высвечивая” все недочеты этапа проектирования.
Следующие пункты представляют основные шаги проектирования базы данных:
Определить информационные потребности базы данных.
Проанализировать объекты реального мира, которые необходимо смоделировать в базе данных. Сформировать из этих объектов сущности и характеристики этих сущностей (например, для сущности “деталь” характеристиками могут быть “название”, “цвет”, “вес” и т.п.) и сформировать их список.
Поставить в соответствие сущностям и характеристикам - таблицы и столбцы (поля) в нотации, выбранной Вами СУБД (Paradox, dBase, FoxPro, Access, Clipper, InterBase, Sybase, Informix, Oracle и т.д.).
Определить атрибуты, которые уникальным образом идентифицируют каждый объект.
Выработать правила, которые будут устанавливать, и поддерживать целостность данных.
Установить связи между объектами (таблицами и столбцами), провести нормализацию таблиц.
Спланировать вопросы надежности данных и, при необходимости, сохранения секретности информации.
Основные концепции реляционных баз данных
Прежде чем подробно рассматривать каждый из этих шагов, остановимся на основных концепциях реляционных баз данных. В реляционной теории одним из главных является понятие отношения. Математически отношение определяется следующим образом. Пусть даны n множеств D1,D2,...,Dn. Тогда R есть отношение над этими множествами, если R есть множество упорядоченных наборов вида <d1,d2,...,dn>, где d1 - элемент из D1, d2 - элемент из D2, ..., dn - элемент из Dn. При этом наборы вида <d1,d2,...,dn> называются кортежами, а множества D1,D2,...,Dn - доменами. Каждый кортеж состоит из элементов, выбираемых из своих доменов. Эти элементы называются атрибутами, а их значения - значениями атрибутов, рис.9-а представляет нам графическое изображение отношения с разных точек зрения.
Рис. 9-а |
Легко заметить, что отношение является отражением некоторой сущности реального мира (в данном случае - сущности “деталь”) и с точки зрения обработки данных представляет собой таблицу. Кортеж представляет собой строку в таблице, или, что то же самое, запись. Атрибут же является столбцом таблицы, или - полем в записи. Домен же представляется неким обобщенным типом, который может быть источником для типов полей в записи. Таким образом, следующие тройки терминов являются эквивалентными:
* отношение, таблица
* кортеж, строка, запись
* атрибут, столбец, поле.
Реляционная база данных представляет собой совокупность отношений, содержащих всю необходимую информацию и объединенных различными связями.
Атрибут (или набор атрибутов), который может быть использован для однозначной идентификации конкретного кортежа (строки, записи), называется первичным ключом. Первичный ключ не должен иметь дополнительных атрибутов. Это значит, что если из первичного ключа исключить произвольный атрибут, оставшихся атрибутов будет недостаточно для однозначной идентификации отдельных кортежей. Для ускорения доступа по первичному ключу во всех системах управления базами данных (СУБД) имеется механизм, называемый индексированием. Грубо говоря, индекс представляет собой инвертированный древовидный список, указывающий на истинное местоположение записи для каждого первичного ключа. Естественно, в разных СУБД индексы реализованы по-разному (в локальных СУБД - как правило, в виде отдельных файлов), однако, принципы их организации одинаковы.
Возможно индексирование отношения с использованием атрибутов, отличных от первичного ключа. Данный тип индекса называется вторичным индексом и применяется в целях уменьшения времени доступа при нахождении данных в отношении, а также для сортировки. Таким образом, если само отношение не упорядочено каким-либо образом и в нем могут присутствовать строки, оставшиеся после удаления некоторых кортежей, то индекс (для локальных СУБД - индексный файл), напротив, отсортирован.
Для поддержания ссылочной целостности данных во многих СУБД имеется механизм так называемых внешних ключей. Смысл этого механизма состоит в том, что некоему атрибуту (или группе атрибутов) одного отношения назначается ссылка на первичный ключ другого отношения; тем самым закрепляются связи подчиненности между этими отношениями. При этом отношение, на первичный ключ которого ссылается внешний ключ другого отношения, называется master-отношением, или главным отношением; а отношение, от которого исходит ссылка, называется detail-отношением, или подчиненным отношением. После назначения такой ссылки СУБД имеет возможность автоматически отслеживать вопросы “ненарушения“ связей между отношениями, а именно:
* если Вы попытаетесь вставить в подчиненную таблицу запись, для внешнего ключа которой не существует соответствия в главной таблице (например, там нет еще записи с таким первичным ключом), СУБД сгенерирует ошибку;
* если Вы попытаетесь удалить из главной таблицы запись, на первичный ключ которой имеется хотя бы одна ссылка из подчиненной таблицы, СУБД также сгенерирует ошибку.
* если Вы попытаетесь изменить первичный ключ записи главной таблицы, на которую имеется хотя бы одна ссылка из подчиненной таблицы, СУБД также сгенерирует ошибку.
Сущность BDE
Мощность и гибкость Delphi при работе с базами данных основана на низкоуровневом ядре - процессоре баз данных Borland Database Engine (BDE). Его интерфейс с прикладными программами называется Integrated Database Application Programming Interface (IDAPI). В принципе, сейчас не различают эти два названия (BDE и IDAPI) и считают их синонимами. BDE позволяет осуществлять доступ к данным как с использованием традиционного record-ориентированного (навигационного) подхода, так и с использованием set-ориентированного подхода, используемого в SQL-серверах баз данных.
Все инструментальные средства баз данных Borland - Paradox, dBase, Database Desktop - используют BDE. Все особенности, имеющиеся в Paradox или dBase, “наследуются” BDE, и поэтому этими же особенностями обладает и Delphi.
Алиасы
Таблицы сохраняются в базе данных. Некоторые СУБД сохраняют базу данных в виде нескольких отдельных файлов, представляющих собой таблицы (в основном, все локальные СУБД), в то время как другие состоят из одного файла, который содержит в себе все таблицы и индексы (InterBase). Например, таблицы dBase и Paradox всегда сохраняются в отдельных файлах на диске. Директорий, содержащий dBase .DBF файлы или Paradox .DB файлы, рассматривается как база данных. Другими словами, любой директорий, содержащий файлы в формате Paradox или dBase, рассматривается Delphi как единая база данных. Для переключения на другую базу данных нужно просто переключиться на другой директорий. Как уже было указано выше, InterBase сохраняет все таблицы в одном файле, имеющем расширение .GDB, поэтому этот файл и есть база данных InterBase.
Удобно не просто указывать путь доступа к таблицам базы данных, а использовать для этого некий заменитель - псевдоним, называемый алиасом. Он сохраняется в отдельном конфигурационном файле в произвольном месте на диске и позволяет исключить из программы прямое указание пути доступа к базе данных. Такой подход дает возможность располагать данные в любом месте, не перекомпилируя при этом программу. Кроме пути доступа, в алиасе указываются тип базы данных, языковый драйвер и много другой управляющей информации. Поэтому использование алиасов позволяет легко переходить от локальных баз данных к SQL-серверным базам (естественно, при выполнении требований разделения приложения на клиентскую и серверную части).
Система регистрации речи диспетчерских переговоров
Инициализация начальных параметров |
Выбор интерфейса |
Загрузка параметров пользователя и Установка режима ожидания |
Загрузка параметров администратора |
Изменение параметров системы |
Просмотр базы данных |
Сохранение параметров |
Проигрывание выбранного файла |
Работа с БД (отбор, удаление записей) |
Режим поднятия трубки оператором (ручной режим) |
Модем в режиме автоподнятия трубки (автоматизированный режим) |
Набор номера оператором |
Регистрируется состояние соединения, установка параметров и начинается запись разговора |
Регистрируется состояние разъединения и проверка параметров записи |
Регистрация в базе данных разговора и сохранение звуковых данных на диске |
Отмена регистрации вызова |
1 |
Выход из программы |
1 |
1 |
Рис 10 |
На рисунке 10 представлена приблизительная схема работы программы. Разберем ее более подробно.
При запуске программы происходит размещение формата и заголовков wav, буфера данных, и получение имени временного файла. Режим рекордера устанавливаем 'нет режима записи'. Дальше проверяем наличие конфигурационного файла ‘config.ini’. Если он отсутствует то, значит, осуществляется первый запуск программы, а значит, требуется ее настройка. Программа автоматически предлагает выбор интерфейса с правами администратора (рис 11).
Рис 11 Рис 12
В другом случае присутствует возможность выбора (рис 12). При нажатии кнопки ‘Вход ’ происходит инициализация ТAPI, в случае отсутствия устройства совместимого с установленными параметрами программа автоматически завершается. Далее в соответствии с выбранным интерфейсом пользователя или администратора происходит загрузка необходимых параметров, а также открытие базы данных.
При выборе интерфейса пользователя необходимо ввести его имя (например, Ф.И.О.). Итак, интерфейс пользователя выглядит следующим образом (рис 13):
Рис 13
Табло состояния отражает события, на которые отвечает модем или им генерируются. Кнопки ‘Взять трубку’ и ‘Положить трубку’ позволяет оператору выполнить в ручном режиме взятие и опускание трубки модема.
Панель набора номера необходима для исходящего звонка оператора. В окошке ‘Набираемый номер’ отражается номер, набранный с клавиатуры компьютера или с помощью мыши на экранной клавиатуре. Присутствуют также кнопки очистки номера, ‘Набрать номер’ – размещение запроса набора номера на модем, ‘Отмена’ – отмена запроса на набор номера (соединение).
Ниже указаны некоторые настройки программы имя модема формат сжатия и его настройки, а также режим ожидания вызова (ручной, авто). ‘Место на диске’ – свободное место на диске в байтах, ‘Записано’ – количество записанных звуковых данных в байтах.
При выборе интерфейса администратора (рис 14) имеется возможность конфигурирования – вкладка ‘Конфигуратор’ или работы с базой данных – вкладка ‘База переговоров’.
Рис 14
На вкладке ‘Конфигуратор’ устанавливаются следующие настройки:
· кнопка ‘Выбор кодека’ – открывается визуальная форма выбора (рис 15)
Рис 15
·
·
·
·
·
· config.ini
На вкладке ‘База переговоров’ обеспечивается работа с базой данных диспетчерских переговоров (рис 16).
Рис 16
На рисунке 17 кнопка 1 обеспечивает отбор записей по диапазону дат указанному в окнах ‘C:’ и ‘по:’, кнопка 2 отменяет прежде установленный отбор, и кнопка 3 удаляет текущую запись из базы данных, а также обеспечивает физическое удаление файла со звуковыми данными с жесткого диска.
1 |
2 |
3 |
Рис 17
На рисунке 18 указаны инструменты для проигрывания текущей записи.
Кнопка 1 позволяет проиграть запись или приостановить ее проигрывание.
Кнопка 2 останавливает запись и освобождает все ресурсы, которые были использованы для нее. Элемент 3 отображает информацию о записи. Элемент 4 визуально показывает на каком этапе находится проигрывание записи.
2 |
1 |
3 |
4 |
Рис 18
Итак, в результате мы можем описать возможности системы кратко так:
- Автоматическая запись всех телефонных разговоров
- Проигрывание записанных сообщений через звуковую карту
- Определение номера вызывающего абонента (для некоторых модемов) и ведение журнала звонков
- Дружественный интерфейс программы позволяет сделать нужные настройки и облегчает работу пользователя.
- Автоматическое или ручное (по выбору) управление модемом
- Вы можете также конвертировать ваши записи в любой голосовой формат - MP3, WAV, и т.п.
4
Запускаем программу в режиме администратор и устанавливаем следующие настройки (рис 19):
Рис 19
То есть, выбираем запись звуковых данных без сжатия(PCM 8кГц, 16 бит, Моно). Далее запускаем программу в режиме пользователя и в результате минутного разговора получаем файл размером 983130 байт.
Теперь запустим программу в режиме администратор и установим другие настройки (рис 20):
Рис 20
Здесь установим речевой кодек – GSM 6.10 8кГц, Моно (16 бит – по умолчанию). Далее запускаем программу в режиме пользователя и в результате разговора продолжительностью около минуты получаем файл размером 85610 байт.
Итак, в результате мы имеем коэффициент сжатия 983130/85610 = 11.48, что удовлетворяет требованиям, обозначенным в задании.
5 Экономическая часть
План выполнения НИР
Одной из основных целей планирования НИР является определение общей продолжительности их проведения. План выполнения данной НИР включает в себя перечень всех основных этапов и видов работ, которые должны быть выполнены, по каждому виду работ определяется квалификационный уровень исполнителей (должность), их число, трудоемкость и длительность выполнения каждой работы.
План выполнения данной НИР представлен в таблице 20.
Таблица 20 |
||||
№ п.п. |
Наименование этапа |
Должность исполнителей |
Трудоемкость, чел.-дни |
Длительность |
1 |
Согласование и утверждение технического задания (ТЗ) на НИР |
Старший научный сотрудник (СНС) |
2 |
2 |
Инженер |
2 |
|||
2 |
Подбор литературы. |
Инженер |
4 |
4 |
3 |
Разработка теоретической части вводного раздела |
Инженер |
2 |
2 |
4 |
Обзор методов сжатия звуковых данных |
инженер |
4 |
4 |
5 |
Разработка алгоритма использования этих методов |
инженер |
6 |
6 |
6 |
Разработка программного продукта. |
инженер |
31 |
31 |
7 |
Экспериментальные исследования и доработка алгоритма |
СНС |
5 |
35 |
инженер |
35 |
|||
8 |
Оформление технического отчета |
инженер |
7 |
7 |
9 |
Сдача темы заказчику |
СНС |
1 |
2 |
инженер |
2 |
|||
ИТОГО: |
93 |
Составление сметы затрат и определение цены на НИР
Цена на НИР складывается из трех составляющих: прямые затраты, накладные расходы и прибыль.
Прямые затраты
Прямые затраты включают в себя заработную плату исполнителя и руководителя НИР, единый социальный налог, амортизационные отчисления.
Основная заработная плата лиц, непосредственно занятых выполнением НИР
Размер основной заработной платы исполнителей НИР (старшего научного сотрудника и инженера) приведен в таблице 2. Дневная заработная плата исполнителей (приведена там же) рассчитывается, исходя из месячной и известного числа рабочих дней в месяце (принимается равным 21).
Единый социальный налог (ЕСН)
ЕСН включают в себя отчисления в пенсионный фонд (20%), в фонд социального страхования (3.2%), в федеральный фонд обязательного медицинского страхования (0.8%), территориальный фонд обязательного медицинского страхования(2%).
Суммарный процент отчислений на социальные нужды составляет 26%.
Амортизационные отчисления.
Сроком полезного использования основного средства признается период, в течение которого объект основных средств служит для выполнения цели деятельности налогоплательщика. Срок полезного использования определяется налогоплательщиком самостоятельно на дату ввода в эксплуатацию данного объекта с учетом классификации основных средств, утверждаемой Правительством РФ (гл.25, ст.258, п.1 НК РФ).
ЭВМ отнесем к третьей амортизационной группе, со сроком полезного использования – 5 лет.
При начислении амортизации будем применять линейный метод. При использовании этого метода норма амортизации определяется по формуле (гл.25, ст.259, п.4 НК РФ):
,
где K – норма амортизации в процентах к первоначальной стоимости основного средства;
N – срок полезного использования основного средства, выраженный в месяцах.
Таким образом, отчисления на амортизацию ЭВМ составляют 20% от цены на ЭВМ в год. Поэтому для определения суммы амортизационных отчислений за время проведения НИР следует воспользоваться формулой
где ЦЭВМ – цена ЭВМ,
tДНЕЙ – время выполнения НИР (в днях),
260 – число рабочих дней в году.
Цена ЭВМ, используемой для написания и отладки программного продукта, составляет около 700 долларов США.
Накладные расходы.
Накладные расходы составляют 15% от прямых затрат. В них включается: заработная плата обслуживающего персонала лаборатории (в которой проводилась НИР), затраты на электроэнергию, плата за отопление и оплата услуг связи.
НР = ПЗ*15%
Сумма прямых затрат и накладных расходов носит название сметной стоимости:
СС = ПЗ +НР
Прибыль
Стандартная величина планируемой прибыли составляет в РГРТА 5% от сметной стоимости
Пр = СС*10%
Сумма сметной стоимости и прибыли даст величину затрат на выполнение данной работы (или, другими словами, цену на НИР):
ЦНИР = СС + Пр
При определении сметы затрат и цены НИР все вычисления по упомянутым формулам велись с помощью программы Excel. В таблице 2 приведён протокол с результатами расчётов.
|
Таблица 21. Протокол расчета сметы затрат и цены НИР |
|
|
||
Оценка экономической эффективности НИР
В данном дипломном проекте была разработана система регистрации речи диспетчерских переговоров. При создании системы был решен целый ряд проблем, которые позволят владельцу системы более эффективно организовать работу. Этими проблемами являются: возможность диспетчера отчитаться за требуемый период времени (запись разговора в файл и регистрация события в базе данных), проблема экономии места на жестком диске (сжатие звуковых данных), в техническом плане – освобождение рук оператора от трубки телефона (подключение телефонной гарнитуры к модему).
Выше сказанное позволяет судить об актуальности и говорит о возможности внедрения этой системы на предприятиях представляющих собой таксопарки.
Экономический эффект может быть достигнут вследствие, снижения стоимости аппаратных средств (за счет сжатия звуковых данных), а также в результате более эффективной организации работы диспетчера.
6 Безопасность и экологичность проекта.
Вступление
Проблемы безопасности человека необходимо решать на всех стадиях жизненного цикла, будь то разработка, внедрение в жизнь или эксплуатация программы.
Так как основная часть дипломного проекта – разработка программы, осуществлялась с помощью ПЭВМ, которая является потребителем электроэнергии. Поэтому значение здесь имеет вопрос об экономном расходе данного вида ресурса. Но так ПЭВМ является экологически чистым оборудованием, то основное внимание в данном разделе будет уделяться безопасности разработчика программы.
Обеспечение безопасности человека в значительной степени зависит от правильной оценки опасных, вредных производственных факторов. Одинаковые по тяжести изменения в организме человека могут быть вызваны различными причинами. Это могут быть какие-либо факторы производственной среды, чрезмерная физическая и умственная нагрузка, нервно-эмоциональное напряжение, а также разное сочетание этих причин.
В данной главе решаются вопросы безопасной жизнедеятельности на стадии разработки программного и методического обеспечения.
Зал вычислительного центра (ВЦ), в котором производилась разработка дипломного проекта, имеет следующие параметры:
размеры помещения – 6 х 4 м;
высота потолка – 3.00 м;
количество рабочих мест с ПЭВМ – 6 (работают инженеры-программисты);
2 окна размером 2´2 м;
1 дверь размером 0.9´2.1 м.
Программисты работают на ПЭВМ мониторы, которых выполнены на базе ЭЛТ.
Питание электрооборудования осуществляется от трёхфазной сети переменного тока частотой 50 Гц напряжением 380/220 В с глухозаземленной нейтралью .
6.2 Анализ опасных и вредных факторов, воздействующих на разработчика при разработке данной системы.
Опасные и вредные производственные факторы по природе возникновения делятся на следующие группы:
-физические;
-химические;
-психофизиологические;
-биологические.
В помещении ВЦ на программиста могут негативно действовать следующие физические факторы согласно ГОСТ 12.0.003-74*[1]:
-неблагоприятные параметры воздушной среды;
-недостаточная освещенность рабочего места;
-блескость экрана дисплея.
-превышающий допустимые нормы шум;
-повышенный уровень ионизирующего излучения;
-повышенный уровень электромагнитных полей;
-повышенный уровень статического электричества;
-мягкое рентгеновское излучение;
-ионизация воздуха;
-опасность поражения электрическим током;
К химически опасным факторам, постоянно действующим на программиста относятся следующие:
-возникновение, в результате ионизации воздуха при работе компьютера, активных частиц.
Биологические вредные производственные факторы в данном помещении отсутствуют.
К психофизиологическим вредным факторам, воздействующим на оператора в течение его рабочей смены можно отнести следующие:
-нервно - психические перегрузки;
-физическая перегрузка мышц;
-монотонность труда;
-малая частота регенерации изображения.
Далее более подробно рассмотрены опасные и вредные факторы, воздействующие на программиста, возникшие в связи с разработкой данной системы.
6.2.1 Микроклимат рабочей зоны разработчика.
Микроклимат производственных помещений - это климат внутренней среды этих помещений, который определяется действующими на организм человека сочетаниями температуры, влажности и скорости движения воздуха.
Работа в ВЦ согласно СанПиН 2.2.2/2.4.1340-03[2] ( с энергозатратами до 120 ккал/час) относится к 1а категории, поэтому должны соблюдаться следующие требования:
-в холодный период года: температура 22-24°С, влажность воздуха 40-60%, скорость движения воздуха 0.1 м/с.
-в тёплый период года: температура 23-25°С, влажность воздуха 40-60%, скорость движения воздуха 0.1 м/с.
Для создания и автоматического поддержания в лаборатории независимо от наружных условий оптимальных значений температуры, влажности, чистоты и скорости движения воздуха, в холодное время года используется водяное отопление, в теплое время года применяется кондиционирование воздуха. Кондиционер представляет собой вентиляционную установку, которая с помощью приборов автоматического регулирования поддерживает в помещении заданные параметры воздушной среды.
6.2.2 Освещение рабочего места
Работа, выполняемая с использованием вычислительной техники, имеет следующие недостатки:
- вероятность появления прямой блескости;
- ухудшенная контрастность между изображением и фоном;
- отражение экрана.
-пульсация света.
В связи с тем, что естественное освещение слабое, на рабочем месте должно применяться также искусственное освещение.
Требования к искусственному освещению описаны в ГОСТ Р 50923-96[3] и СанПиН 2.2.2/2.4.1340-03[2] для работников вычислительных центров.
Искусственное освещение в помещениях эксплуатации ПЭВМ осуществляется системой общего равномерного освещения.
В производственных и административно-общественных помещениях, в случаях преимущественной работы с документами, разрешено применение системы комбинированного освещения (к общему освещению дополнительно устанавливаются светильники местного освещения, предназначенные для освещения зоны расположения документов).
Освещенность на поверхности стола в зоне размещения рабочего документа должна быть 300-500 лк(оптимальная-400лк), также допускается установка светильников местного освещения для подсветки документов, но с таким условием, чтобы оно не создавало бликов на поверхности экрана и не увеличивало освещенность экрана более чем на 300 лк относительно оптимальной.
В качестве источников света при искусственном освещении должны применяться преимущественно люминесцентные лампы типа ЛБ. При устройстве отраженного освещения в административно-общественных помещениях допускается применение металлогалогенных ламп мощностью до 250 Вт. Допускается применение ламп накаливания в светильниках местного освещения.
Общее освещение следует выполнять в виде сплошных или прерывистых линий светильников, расположенных сбоку от рабочих мест, параллельно линии зрения пользователя при рядном расположении ПЭВМ. При периметральном расположении компьютеров линии светильников должны располагаться локализовано над рабочим столом, ближе к его переднему краю, обращенному к оператору.
Для обеспечения нормируемых значений освещенности в помещениях использования ПЭВМ следует проводить чистку стекол оконных рам и светильников не реже двух раз в год и проводить своевременную замену перегоревших ламп.
6.2.3 Воздействие шума на разработчика. Защита от шума.
В помещениях с низким уровнем общего шума, каким является ВЦ, где работает программист, источниками шумовых помех могут стать вентиляционные установки, кондиционеры и принтеры. Длительное воздействие этих шумов отрицательно сказываются на эмоциональном состоянии персонала, от чего увеличивается число ошибок и падает производительность труда.
Согласно ГОСТ Р 50923-96[3] и СН 2.2.4/2.1.8.562-03[2] эквивалентный уровень звука не должен превышать 50 дБА, так как наше помещение расположено в жилом общественном здании.
В качестве мер по снижению шума можно предложить следующее:
-облицовка потолка и стен звукопоглощающим материалом;
- экранирование рабочего места (постановкой перегородок);
- установка в компьютерных помещениях оборудования, производящего минимальный шум;
- рациональная планировка помещения.
Защиту от шума следует выполнять в соответствии с ГОСТ 12.1.029-80[5]
6.2.4 Опасность повышенного уровня напряженности электромагнитного поля.
Электромагнитные поля, характеризующиеся напряженностями электрических и магнитных полей, наиболее вредны для организма человек. Основным источником этих проблем, связанных с охраной здоровья людей, использующих в своей работе автоматизированные информационные системы на основе персональных компьютеров, являются дисплеи (мониторы), особенно дисплеи с электронно-лучевыми трубками. Они представляют собой источники наиболее вредных излучений, неблагоприятно влияющих на здоровье программиста.
Существуют два основополагающих стандарта в этой области: ГОСТ Р 50948-96[6] и ГОСТ Р 50949-96[7] .
Ниже приведены нормы по электрическим и магнитным полям согласно СанПиН 2.2.2/2.4.1340-03[2].
-Напряжённость переменного электрического поля на расстоянии 50 см вокруг дисплея:
в диапазоне частот 5 Гц – 2 Кгц: не более 25 В/м;
в диапазоне частот2 Кгц – 400 Кгц: не более 2.5 В/м.
-Плотность магнитного потока (магнитная индукция):
в диапазоне частот 5 Гц – 2 Кгц: не более 250 нТл;
в диапазоне частот2 Кгц – 400 Кгц: не более 25 нТл.
- Напряженность электростатического поля не более 15 кВ/м.
ГОСТ Р 51658-2000[14] - стандарт устанавливает требования к визуальным параметрам защитных фильтров, параметрам экранировки по электростатическому и переменным электрическим полям.
Поля, порождённые посторонними источниками (фоновые поля), определяются физическими особенностями этих источников и положением их по отношению к рабочему месту. Часто фоновые поля имеют общий источник – сеть электропитания, дающую существенный вклад на частоте 50 Гц и её гармониках. Этот вклад во многом зависит от правильности организации электросети и контура зануления, удалённости и расположения рабочего места относительно розеток питания и других элементов сети. Особого внимания требуют случаи появления экстремальных полей посторонних источников, которые могут не только многократно превышать гигиенические требования, но и нарушать нормальную работу ПЭВМ. Исследование причин появления экстремальных полей, путей их снижения и устранения требует привлечения специализированных организаций, имеющих опыт решения таких задач и необходимую для этого аппаратуру.
6.2.5 Электробезопасность. Статическое электричество.
Питание электрооборудования осуществляется от трёхфазной сети переменного тока частотой 50 Гц напряжением 380/220 В с глухозаземленной нейтралью.
На рабочем месте программиста из всего оборудования металлическим является лишь корпус системного блока компьютера, но здесь используются системные блоки, отвечающие стандарту фирмы IBM, в которых кроме рабочей изоляции предусмотрен элемент для заземления и провод с зануляющей жилой для присоединения к источнику питания. Таким образом, оборудование выполнено по классу 1 ГОСТ 12.2.007.0-75* [8].
Опасное и вредное воздействие на людей электрического тока, электрической дуги и электромагнитных полей проявляется в виде профессиональных заболеваний.
Рассмотрим основные причины поражения программиста электрическим током на рабочем месте:
- Прикосновение к металлическим нетоковедущим частям (корпусу, периферии компьютера), которые могут оказаться под напряжением в результате повреждения изоляции.
- Нерегламентированное использование электрических приборов.
- Отсутствие инструктажа сотрудников по ПТЭ и ПТБ[17].
Обеспечение электробезопасности техническими способами и средствами
Так как все токоведущие части ЭВМ изолированы, то случайное прикосновение в процессе работы программиста к токоведущим частям исключено.
Для обеспечения дополнительной защиты от поражения электрическим током при прикосновении к металлическим нетоковедущим частям, которые могут оказаться под напряжением в результате повреждения изоляции, рекомендуется применять защитное зануление.
Зануление металлических частей системного блока ЭВМ обеспечено подведением зануляющей жилы к питающим розеткам. Сопротивление заземления нейтрали 4 Ом, согласно ПУЭ-03[15] для электроустановок с напряжением до 1000 В.
Организационные и технические мероприятия по обеспечению электробезопасности
Основным организационным мероприятием является инструктаж и обучение безопасным методам труда, а так же проверка знаний правил безопасности и инструкций в соответствии с занимаемой должностью применительно к выполняемой работе.
При проведении незапланированного и планового ремонта вычислительной техники выполняются следующие действия:
- Отключение компьютера от сети
- Проверка отсутствия напряжения
После выполнения этих действий проводится ремонт неисправного оборудования. Ремонт необходимо производить в специально оборудованном помещении.
Если ремонт проводится на токоведущих частях, находящихся под напряжением, то выполнение работы проводится не менее чем двумя лицами с применением электрозащитных средств.
6.3 Организация рабочего места разработчика.
Производственная деятельность программиста, заставляет его продолжительное время находиться в сидячем положении, которое является вынужденной позой, поэтому организм постоянно испытывает недостаток в подвижности и активной физической деятельности. При выполнении работы, сидя, большую роль играет плечевой пояс. Перемещение рук в пространстве влияет не только на работу мышц плечевого пояса и спины, но и на положение позвоночника, таза и даже ног.
Чтобы исключить возникновение заболеваний необходимо иметь возможность свободной перемены поз. Необходимо соблюдать режим труда и отдыха с перерывами, заполняемыми "отвлекающими" мышечными нагрузками на те звенья опорно-двигательного аппарата, которые не включены в поддержание основной рабочей позы. (ГОСТ Р 50923-96[3] )
Антропологические характеристики человека определяют габаритные и компоновочные параметры его рабочего места, а также свободные параметры отдельных его элементов.
По условиям работы рабочее место программиста относится к индивидуальному рабочему месту для работы сидя.
Рабочее место программиста согласно СанПиН 2.2.2/2.4.1340-03[2] должно занимать площадь не менее 6 м2 на одного человека, так как используются мониторы на базе ЭЛТ.
После проведения анализа рабочего места программиста в ВЦ было выяснено, что площадь данного рабочего места составляет 4 м2, что не соответствует приведенным требованиям. Также в результате анализа были выявлены нарушения в организации непосредственно самого рабочего места программиста. В связи с этим предлагается организовать рабочее место программиста, следующим образом. Высота над уровнем пола рабочей поверхности, за которой работает программист, должна составлять 720 мм. Желательно, чтобы рабочий стол программиста при необходимости можно было регулировать по высоте в пределах 680 - 780 мм. Оптимальные размеры поверхности стола 1600 х 1000 кв. мм. Под столом должно иметься пространство для ног с размерами по глубине 650 мм. Рабочий стол оператора должен также иметь подставку для ног, расположенную под углом 15° к поверхности стола. Длина подставки 400 мм, ширина-350 мм. Удаленность клавиатуры от края стола должна быть не более 300 мм, что обеспечит оператору удобную опору для предплечий. Расстояние между глазами оператора и экраном видеодисплея должно составлять 40 - 80 см.
Рабочий стул программиста должен быть снабжен подъемно-поворотным механизмом. Высота сиденья должна регулироваться в пределах 400 - 500 мм. Глубина сиденья должна составлять не менее 380 мм, а ширина не менее 400 мм. Высота опорной поверхности спинки не менее 300 мм, ширина - не менее 380 мм. Угол наклона спинки стула к плоскости сиденья должен изменяться в пределах 90 - 110°.
6.4 Анализ пожарной безопасности
Степень огнестойкости зданий принимается в зависимости от их назначения, категории по взрывопожарной и пожарной опасности, этажности, площади этажа в пределах пожарного отсека.
Общие требования по пожарной безопасности регламентируются ГОСТ 12.1.004-91[10].
Здание, в котором находится ВЦ, по пожарной опасности строительных конструкций относится к категории К1 (малопожароопасное), поскольку здесь присутствуют горючие (книги, документы, мебель, оргтехника и т.д.) и трудносгораемые предметы (сейфы, различное оборудование и т.д.).
По конструктивным характеристикам здание можно отнести к зданиям с несущими и ограждающими конструкциями из естественных или искусственных каменных материалов, бетона или железобетона, где для перекрытий допускается использование деревянных конструкций, защищенных штукатуркой или трудногорючими листовыми, а также плитными материалами.
Следовательно, степень огнестойкости здания можно определить как третью (III). ГОСТ Р 22.7.01-99[11], СНиП 2.04.09-84[12].
Помещение ВЦ по функциональной пожарной опасности относится к классу Ф 4.3 - учреждения органов управления, проектно-конструкторские организации, информационные и редакционно-издательские организации, научно-исследовательские организации, банки, конторы, офисы; СНиП 21-01-97[13].
Для предотвращения возникновения пожара на рабочем месте необходимо соблюдение правил пожарной безопасности (ППБ 01-03[16]), кроме того, действует федеральный закон «О пожарной безопасности» № 69-ФЗ (от 21.12.1994г.).
Пожарная профилактика представляет собой комплекс организационных и технических мероприятий, направленных на обеспечение безопасности людей, на предотвращении пожара, ограничение его распространения, а также создание условий для успешного тушения пожара. Для профилактики пожара чрезвычайно важна правильная оценка пожароопасности здания, определение опасных факторов и обоснование способов и средств пожаропредупреждения и защиты ППБ 01-03[16].
Одно из условий обеспечения пожаробезопасности - ликвидация возможных источников воспламенения.
В ВЦ источниками воспламенения могут быть:
-неисправное электрооборудование, неисправности в электропроводке, электрических розетках и выключателях. Для исключения возникновения пожара по этим причинам необходимо вовремя выявлять и устранять неисправности, проводить плановый осмотр и своевременно устранять все неисправности;
-неисправные электроприборы. Необходимые меры для исключения пожара включают в себя своевременный ремонт электроприборов, качественное исправление поломок, не использование неисправных электроприборов;
-обогревание помещения электронагревательными приборами с открытыми нагревательными элементами. Открытые нагревательные поверхности могут привести к пожару, так как в помещении находятся бумажные документы и справочная литература в виде книг, пособий, а бумага легковоспламеняющийся предмет. В целях профилактики пожара предлагается не использовать открытые обогревательные приборы в помещении ВЦ.
- несоблюдение мер пожарной безопасности, и курение в помещении также может привести к пожару. Для устранения возгорания в результате курения в помещении ВЦ предлагается категорически запретить курение, а разрешить только в строго отведенном для этого месте.
В целях предотвращения пожара предлагается проводить с инженерами, работающими в ВЦ, противопожарный инструктаж, на котором ознакомить работников с правилами противопожарной безопасности, а также обучить использованию первичных средств пожаротушения.
В случае возникновения пожара необходимо отключить электропитание, вызвать по телефону пожарную команду, эвакуировать людей из помещения согласно плану эвакуации и приступить к ликвидации пожара огнетушителями. При наличии небольшого очага пламени можно воспользоваться подручными средствами с целью прекращения доступа к объекту возгорания.
Для тушения пожаров на начальных стадиях широко применяются огнетушители. По виду используемого огнетушащего вещества огнетушители подразделяются на следующие основные группы.
Пенные огнетушители, применяются для тушения горящих жидкостей, различных материалов, конструктивных элементов и оборудования, кроме электрооборудования, находящегося под напряжением.
Газовые огнетушители применяются для тушения жидких и твердых веществ, а также электроустановок, находящихся под напряжением.
К системам сигнализации предъявляются следующие технические требования: они должны иметь минимальную инерционность сработки, обеспечивать заданную достоверность информации, отсутствие ошибочной сработки; быть надежными в работе при всех условиях эксплуатации, обеспечивать автономное включение сигнала тревоги.
Основными элементами пожарной сигнализации являются:
датчики пожарной сигнализации, которые размещаются в наиболее пожаро- и взрывоопасных местах;
электронно-усилительный блок, который обеспечивает дистанционный контроль за состоянием датчиков;
исполнительный блок, с помощью которого включается первый рубеж противопожарной системы и блок сигнализации.
Датчики – наиболее важный элемент системы сигнализации, который в основном определяет возможности и характеристики системы в целом.
В качестве пожарных извещателей выбираем 10 тепловых датчиков типа ИП-103М-5АС; в качестве средств пожаротушения – один углекислотный огнетушитель ОУ-5, в силу условий, приведенных выше.
6.5 Расчет искусственного освещения
Конечной целью расчёта искусственного освещения является определение типа, числа и расположения светильников, а также типа, числа и мощности ламп, необходимых для обеспечения требуемого нормативного уровня освещенности.
Расчёт освещения производился в системе MathCAD 2000. Помещение имеет следующие характеристики:
Нормативные уровни освещенности рабочего места осуществляются согласно СНиП 23-05-95[19] .
Eнорм – нормированная минимальная освещенность для нашего помещения равна 300 лк.
Показатель ослепленности P= 20 %
Коэффициент пульсаций освещенности Kп= 15 %
Для искусственного освещения рабочих мест с ПЭВМ следует использовать люминесцентные лампы, имеющие высокую световую отдачу (до 75 лм/Вт и более), большой срок службы (до 10000 ч), малую яркость светящейся поверхности, а также близкий к естественному спектр излучения, что обеспечивает хорошую цветопередачу. Наиболее целесообразным для применения освещения рабочих мест с ПЭВМ рекомендуются люминесцентные лампы 36-65 Вт типа ЛБ (белого цвета) или лампы типа ЛТБ (тёпло-белого цвета) мощностью 20 или 40 Вт.
При питании газоразрядных ламп от сети переменного тока осветительные установки кроме нормативных условий освещенности должны также удовлетворять требованию приемлемого уровня пульсаций освещенности.
В связи с тем, что в люминесцентных лампах пульсации генерируемого светового потока существенно сглаживаются люминофором, покрывающим внутреннюю поверхность трубчатой колбы, можно считать, что при их использовании требования к коэффициенту пульсаций удовлетворяются автоматически .
Выбирая систему освещения, необходимо учитывать, что более эффективной является система комбинированного освещения, но система общего освещения более гигиенична, т.к. обеспечивает большую равномерность освещенности рабочих поверхностей, поэтому остановимся на последней.
Тип светильников определяется с учётом требований к освещению данного помещения, по экономическим показателям, а также в зависимости от условий среды и требований взрыво- и пожаробезопасности. Таким образом, конструктивное исполнение светильников должно соответствовать условиям окружающей среды: влажности, запыленности, пожаро- и взрывоопасности и другим особенностям производства.
Расположение светильников оказывает существенное влияние на экономичность, качество и удобство эксплуатации системы освещения и должно обеспечивать заданные уровни освещённости на всех рабочих местах при наименьшей мощности установленных ламп. Это возможно благодаря выбору наивыгоднейшего соотношения между расстоянием между рядами светильников и высотой подвеса светильника над рабочей поверхностью.
Поскольку мощность люминесцентных ламп и их количество в светильнике известны, то расчёт числа светильников будем вести по формуле (1) .
7 Заключение
В данном дипломном проекте была разработана система регистрации речи диспетчерских переговоров. При создании системы был решен целый ряд проблем, которые позволят владельцу системы более эффективно организовать работу. Этими проблемами являются: возможность диспетчера отчитаться за требуемый период времени (запись разговора в файл и регистрация события в базе данных), проблема экономии места на жестком диске (сжатие звуковых данных), в техническом плане – освобождение рук оператора от трубки телефона (подключение телефонной гарнитуры к модему).
Использование данной системы возможно только в том случаи, если установлен механизм работы с базой данных – BDE, а также желательно наличие ОС WidowsXP.
Возможно, также исправление узких мест системы, если таковые обнаружатся в ходе использования данной системы или же может иметь место увеличение производительности системы в плане повышения функциональности (например, добавления возможности распечатки отчетов и т. д.)
Список литературы
1. ГОСТ 12.0.003-74 “ОПАСНЫЕ И ВРЕДНЫЕ ПРОИЗВОДСТВЕННЫЕ ФАКТОРЫ. Классификация”
2. СанПиН 2.2.2.542-03 “Гигиенические требования к персональным электронно-вычислительным машинам и организации работы”
3. ГОСТ Р 50923-96 “Дисплеи. Рабочее место оператора. Общие эргономические требования и требования к производственной среде. Методы измерения.”
4. СН 2.2.4/2.1.8.562-03 “Шум на рабочих местах в помещениях жилых общественных зданий и на территории жилой застройки”
5. ГОСТ 12.1.029-80 “Средства и методы защиты от шума. Классификация”
6. ГОСТ Р 50948-96 “Средства отображения информации индивидуального пользования. Общие эргономические требования и требования безопасности”
7. ГОСТ Р 50949-96 “Средства отображения информации индивидуального пользования. Методы измерения и оценки эргономических параметров и параметров безопасности”
8. Гост 12.2.007.0-75* “ИЗДЕЛИЯ ЭЛЕКТРОТЕХНИЧЕСКИЕ.Общие требования безопасности”
9. ГОСТ 12.1.019-79 “Электробезопасность. Общие требования и номенклатура видов защиты”
10. ГОСТ 12.1.004-91 “ПОЖАРНАЯ БЕЗОПАСНОСТЬ”
11. ГОСТ Р 22.7.01-99 “Безопасность в чрезвычайных ситуациях. Единая дежурно-диспетчерская служба. Основные положения”
12. СНиП 2.04.09-84 “ПОЖАРНАЯ АВТОМАТИКА ЗДАНИЙ И СООРУЖЕНИЙ”
13. СНиП 21-01-97 “ПОЖАРНАЯ БЕЗОПАСНОСТЬ ЗДАНИЙ И ОРУЖЕНИЙ”
14. ГОСТ Р 51658-2000 "Фильтры-экраны защитные для средств отображения информации. Типы, основные параметры и методы измерений".
15. ПУЭ-03 “Правила устройства электроустановок”
16. ППБ 01-03 “Правила пожарной безопасности”
17. ПТЭ и ПТБ “Правила технической эксплуатации электрических станций и сетей РФ” и “Правила техники безопасности при эксплуатации электрических станций и сетей РФ”
18. Материалы по Delphi на сайте http://www.delphikingdom.com (сеть Internet)
19. П.Дарахвелидзе, Е.Марков “Программирование в Delphi7” СПб.: БХВ-Петербург, 2004
20. С.Бобровский “Delphi7. Учебный курс” СПб.: Питер, 2004
21. В. Никамин. "Форматы цифровой звукозаписи". СПб.: Элби, 1998
22. Н. Секунов. "Обработка звука на PC". - СПб.: БХВ-Петербург, 2001
23. 8. Д. Смирнов, О. Логутенко. "Аудиосистема РС". СПб.: БХВ-Петербург, 1999
24. И. Кузнецов “Обзор возможностей системы Audio Compression Manager (ACM)”
25. Е. Музыченко. "Подсистема сжатия звука в Windows". Компьютер-Пресс, №7-2000
26. Е. Музыченко. " Обработка звуковых файлов в Windows". Компьютер-Пресс, №8-2000
27. “Acorp-EMSF2 V90\V92 modem. Руководство пользователя” DdiX Labs. 2002
28. “Telephony Application Programming Interface (TAPI) Programmer's Reference” 1995-1996 Microsoft Corporation. All rights reserved
29. “MSDN Library - October 2004” Microsoft Corporation. All rights reserved
30. Материалы по TAPI на сайте http://www.delphiclub.de (сеть Internet)
Приложение 1
Исходный текст программы
program SysWave;
uses
Forms,
main in 'main.pas' {SysWaves},
DataMode in 'DataMode.pas' {DataModule1: TDataModule},
About in 'About.pas' {Abouts},
VarTo in 'VarTo.pas' {VarS};
{$R *.res}
begin
Application.Initialize;
Application.CreateForm(TSysWaves, SysWaves);
Application.CreateForm(TDataModule1, DataModule1);
Application.CreateForm(TAbouts, Abouts);
Application.CreateForm(TVarS, VarS);
Application.Run;
end.
Главный модуль
unit main;
interface
uses
Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
Dialogs, Menus, ComCtrls, StdCtrls, XPMan, Buttons,IniFiles, Mask,mmSystem,
Grids, DBGrids,DataMode, ExtCtrls,About, TAPITon, TAPIAddress,MSAcm,
TAPIDevices, TAPICall, TAPILines, TAPISystem, DevConf, TAPIServices,
TAPILineSelectDialog, TAPIWave,VarTo, TAPIPhone;
type
TRecorderMode = (recModeOff, recModeRecord, recModePlay);
TSysWaves = class(TForm)
PageControl1: TPageControl;
TabSheet1: TTabSheet;
TabSheet2: TTabSheet;
MainMenu1: TMainMenu;
exit1: TMenuItem;
GroupBox2: TGroupBox;
TabSheet3: TTabSheet;
XPManifest1: TXPManifest;
SaveConf: TBitBtn;
DBGrid1: TDBGrid;
Play: TBitBtn;
Answer: TBitBtn;
DisplayMemo: TMemo;
HandsetDown: TBitBtn;
GroupBox3: TGroupBox;
Panel1: TPanel;
SpeedButton1: TSpeedButton;
SpeedButton2: TSpeedButton;
SpeedButton3: TSpeedButton;
SpeedButton4: TSpeedButton;
SpeedButton5: TSpeedButton;
SpeedButton6: TSpeedButton;
SpeedButton7: TSpeedButton;
SpeedButton8: TSpeedButton;
SpeedButton9: TSpeedButton;
SpeedButton10: TSpeedButton;
DialNo: TBitBtn;
CancelNo: TBitBtn;
GroupBox4: TGroupBox;
CallNo: TEdit;
About1: TMenuItem;
TAPICall1: TTAPICall;
TAPILine1: TTAPILine;
CallParams1: TCallParams;
TAPILineDevice1: TTAPILineDevice;
TAPIAddress1: TTAPIAddress;
TAPILineDeviceConfig1: TTAPILineDeviceConfig;
TAPILineService1: TTAPILineService;
Bevel1: TBevel;
Timer1: TTimer;
FormatTagLabel: TLabel;
FormatDescLabel: TLabel;
Label6: TLabel;
Label7: TLabel;
LengthDispLabel: TLabel;
LengthPosLabel: TLabel;
TrackBar1: TTrackBar;
Label8: TLabel;
Label9: TLabel;
Label10: TLabel;
Label11: TLabel;
Bevel2: TBevel;
DelTrack: TSpeedButton;
Stop: TBitBtn;
GroupBox5: TGroupBox;
Bevel3: TBevel;
GetFormatTag: TLabel;
GetFormatDesc: TLabel;
GetFormat: TBitBtn;
GroupBox6: TGroupBox;
Label3: TLabel;
MaskEdit1: TMaskEdit;
CheckBox1: TCheckBox;
GroupBox1: TGroupBox;
RadioButton1: TRadioButton;
RadioButton2: TRadioButton;
Timer2: TTimer;
FTLabel: TLabel;
FDLabel: TLabel;
ClearNo: TSpeedButton;
Label1: TLabel;
MaskEdit2: TMaskEdit;
Bevel4: TBevel;
ModemName: TLabel;
Label2: TLabel;
Label4: TLabel;
Timer3: TTimer;
DevName: TLabel;
GroupBox7: TGroupBox;
DateTimePicker1: TDateTimePicker;
DateTimePicker2: TDateTimePicker;
Label5: TLabel;
Label12: TLabel;
Select: TSpeedButton;
NoSelect: TSpeedButton;
TAPIPhoneService1: TTAPIPhoneService;
TAPIPhoneDevice1: TTAPIPhoneDevice;
TAPIPhone1: TTAPIPhone;
SpeedButton11: TSpeedButton;
SpeedButton12: TSpeedButton;
GroupBox9: TGroupBox;
HeadSetVolume: TProgressBar;
HeadSetGain: TProgressBar;
HandSetVolume: TProgressBar;
HandSetGain: TProgressBar;
HeadSetVolUpDown: TUpDown;
HeadSetGainUpDown: TUpDown;
HandSetVolUpDown: TUpDown;
HandSetGainUpDown: TUpDown;
Image1: TImage;
Image2: TImage;
Label13: TLabel;
Label14: TLabel;
Label15: TLabel;
Label16: TLabel;
procedure SaveConfClick(Sender: TObject);
procedure PlayClick(Sender: TObject);
procedure FormDestroy(Sender: TObject);
procedure FormShow(Sender: TObject);
procedure About1Click(Sender: TObject);
procedure DialNoClick(Sender: TObject);
procedure SpeedButton1Click(Sender: TObject);
procedure SpeedButton2Click(Sender: TObject);
procedure SpeedButton3Click(Sender: TObject);
procedure SpeedButton4Click(Sender: TObject);
procedure SpeedButton5Click(Sender: TObject);
procedure SpeedButton6Click(Sender: TObject);
procedure SpeedButton7Click(Sender: TObject);
procedure SpeedButton8Click(Sender: TObject);
procedure SpeedButton9Click(Sender: TObject);
procedure SpeedButton10Click(Sender: TObject);
procedure CancelNoClick(Sender: TObject);
procedure TAPICall1StateConnected(Sender: TObject;
ConnectedMode: TLineConnectedModes; Rights: TLineCallPrivilege);
procedure TAPICall1StateDisconnected(Sender: TObject;
DisconnectedMode: TLineDisconnectMode; Rights: TLineCallPrivilege);
procedure TAPICall1StateProceeding(Sender: TObject;
Rights: TLineCallPrivilege);
procedure TAPILineDevice1StateRinging(Sender: TObject; RingModeIndex,
RingCounter: Cardinal);
procedure TAPICall1InfoCallerId(Sender: TObject);
procedure exit1Click(Sender: TObject);
procedure AnswerClick(Sender: TObject);
procedure GetFormatClick(Sender: TObject);
procedure StopClick(Sender: TObject);
procedure Timer1Timer(Sender: TObject);
procedure SpeedButton11Click(Sender: TObject);
procedure ClearNoClick(Sender: TObject);
procedure RadioButton1Click(Sender: TObject);
procedure TAPILineDevice1StateReMoved(Sender: TObject);
procedure Timer3Timer(Sender: TObject);
procedure HandsetDownClick(Sender: TObject);
procedure SelectClick(Sender: TObject);
procedure NoSelectClick(Sender: TObject);
procedure DelTrackClick(Sender: TObject);
procedure FormClose(Sender: TObject; var Action: TCloseAction);
procedure TAPICall1Reply(Sender: TObject; AsyncFunc: TAsyncFunc;
Error: Cardinal);
procedure SpeedButton12Click(Sender: TObject);
procedure TAPICall1StateBusy(Sender: TObject; BusyMode: TLineBusyMode;
Rights: TLineCallPrivilege);
procedure HeadSetVolUpDownChangingEx(Sender: TObject;
var AllowChange: Boolean; NewValue: Smallint;
Direction: TUpDownDirection);
procedure HeadSetGainUpDownChangingEx(Sender: TObject;
var AllowChange: Boolean; NewValue: Smallint;
Direction: TUpDownDirection);
procedure HandSetVolUpDownChangingEx(Sender: TObject;
var AllowChange: Boolean; NewValue: Smallint;
Direction: TUpDownDirection);
procedure HandSetGainUpDownChangingEx(Sender: TObject;
var AllowChange: Boolean; NewValue: Smallint;
Direction: TUpDownDirection);
procedure TAPICall1StateOffering(Sender: TObject;
OfferingMode: TLineOfferingModes; Rights: TLineCallPrivilege);
procedure TAPICall1StateIdle(Sender: TObject;
Rights: TLineCallPrivilege);
procedure Button1Click(Sender: TObject);
procedure Button2Click(Sender: TObject);
private
{ Private declarations }
FPulse : boolean;{признак импульсного набора номера}
FAutoAnswer : boolean;{признак автоответа модема}
ConfigFile : TIniFile;{переменная инициализационного файла}
FTimeReg : integer;{Время регистрации}
FTimeCounter : integer;{счетчик времени}
VG : array[1..4] of integer;{массив с настройками телефонной
гарнитуры}
{******************Для работы со звуковыми данными*************************************************************}
FWaveInID : DWORD;{индификатор Wave устройства}
FWaveFormat : PWAVEFORMATEX;{указатель на структуру ТWAVEFORMATEX
(формата звуковых данных)}
FTotalWaveSize : DWORD;{ Номер записанных выборок }
FByteDataSize : DWORD;{ Накапливаемый размер записанных данных}
FDiskFreeSpace : DWORD;{Свободное пространство для временного файла }
FWaveHdr : array [0..1] of PWAVEHDR;{ Точки доступа к wav информации
заголовка}
FWaveMem : array [0..1] of PChar;{Точки доступа к wav буферам }
FBufIndex : Integer;{ Номер буфера который добавляется для использования}
FWaveIn : HWAVEIN;//Маркер{Дескриптор} устройства для того, чтобы
//делать запись
FWaveOut : HWAVEOUT;//Маркер{Дескриптор} устройства для проигрывания звука
FMaxFmtSize : DWORD;// наибольший размер формата, требуемый для сжатия
FFormatDesc : String;// Описание формата
FFormatTag : String;// Описание тэга формата
FDeviceOpened : Boolean;// состояние открытия устройства
FRecorderMode : TRecorderMode;//Режим рекордера
//записи/проигрывания/не активности
FWaveBufSize : DWORD;// Размер буфера
FFilename : String;// Имя файла, чтобы сохранить WAV
FMoreToPlay : Boolean; //признак наличия звуковых данных, чтобы проигрывать
FRecordedData : Boolean;// мы сделали запись данных
FTmpFileName : String;//имя временного WAV файла
FTmpFileHandle : HFILE; // Маркер{Дескриптор} к временному WAV файлу
//==============работа с временым файлом========================================
function OpenTmpFile : Integer; // Открытие временного файла для чтения.
function CreateTmpFile : integer; // Создание временного файла чтобы писать
//wav данные.
procedure DeleteTmpFile; // Удаление временного wav файла.
procedure CloseTmpFile; // Закрытие временного файла содержащего недавно
//записаные данные.
//==================работа с записью============================================
procedure StopWaveRecord;// Остановка записи.
function StartWaveRecord : Integer;// Подготовка заголовков, добавление
//буфера, подготовка показа, и начало записи.
procedure InitWaveHeaders;// Обнуляет заголовки wav и инициализирует
//указатели данных и буферные длины
procedure CloseWaveDeviceRecord;//Закрытие временного файл и устройства,
//делающего запись.
procedure UpdateLength(BytePosition : DWORD; BytePositiontotal : DWORD);//
// Обновление на экране числа записанных байт
function AddNextBuffer : integer;// Добавление буфера к очереди и
//переключение индекса буфера
procedure UpdateRecordDisplay;// обновления количества записанных байтов
//================сохранение файла==============================================
function SaveWaveFile : integer;// Сохранение wav файла
procedure WFerror(mmfp : HMMIO; const msg : String); // Закрытие wav файла,
//вывод сообщения об ошибках
function CopyDataToWaveFile(mmfp : HMMIO) : integer;// Копирование wav данных
//из временного файла в wav файл
//======================получение и установка кодеков===========================
function GetWaveFormat : integer; //функция вызывающая визуальный выбор кодека
function GetFormatTagDetails(wFormatTag : WORD) : integer; // Получение
//подробности тэга формата, и сохранение строкового описания.
//=========================инициализация========================================
function InitWaveRecorder : integer;//Размещение формата и заголовков wav,
//буфера данных, и получение временного имени файла
function AllocWaveFormatEx : Integer;//Размещение и захват структуры WAVEFORMATEX,
//основанную на максимальном размере формата согласно ACM.
function GetFormatDetails(pfmtin : PWAVEFORMATEX) : integer; // Получение
//подробности формата, и сохранение строкового описания.
function AllocWaveHeader : integer; //размещение в памяти заголовка wave
function AllocPCMBuffers : Integer;//размещение wave буфера в памяти
//========================завершение============================================
procedure DestroyWaveRecorder; // Освобождение памяти, связанной с буферами wav.
procedure FreeWaveFormatEx; // Освобождение WAVEFORMATEX буфера
procedure FreeWaveHeader; //Освобождение памяти заголовка wav.
procedure FreePCMBuffers; //Освобождение памяти wav.
//===================проигрывание звука=========================================
function ReadWaveFile : Integer;//Чтение wav файла
function CopyWaveToTempFile(mmfp : HMMIO; datasize : DWORD) : Integer;//
//Копирование данных из wav файла RIFF во временый файл.
function StartWavePlay : Integer;//Подготовка заголовков, добавление буферов,
//и начало проигрывания.
procedure StopWavePlay; //остановка проигрывания wav файла
procedure CloseWaveDevicePlay; // закрытие устройства проигрывания
function QueueNextBuffer : Integer;// Запись из буфера в wav устройство и
//переключение индекса буфера .
function ReadWaveBuffer : Integer;// Чтение куска wav из временного файла
//====================работа с сообщениями wave=================================
procedure MMWimData(var msg: TMessage); message MM_WIM_DATA; //вызывается
//если устройство завершило передачу данных в блок памяти, установленный
//процедурой waveInAddBuffer;
procedure MMWomDone(var msg: TMessage); message MM_WOM_DONE; // Сделать
//проигрывание очередного волнового буфера, если проигран предыдущий.
procedure MMWomClose(var msg: TMessage); message MM_WOM_CLOSE;// посылается,
//когда устройство закрывается функцией waveOutClose;
function WriteWaveBuffer(size : UINT) : integer; // Запись записаных даных
//в временый файл
{*******************************************************************************************************************************}
procedure Display(Msg : String); // выводит сообщение Msg на DisplayMemo
procedure errormsg(msg : String); // Отобразите сообщение об ошибках.
public
{ Public declarations }
end;
const
{Тип FOURCC
Описывает коды, используемых в формате RIFF (Resource Interchange File Format -
формат файлов обмена ресурсами). }
WAVE_BUFSIZE = 32768;
FOURCC_WAVE = $45564157; { 'WAVE' }
FOURCC_FMT = $20746d66; { 'fmt ' }
FOURCC_FACT = $74636166; { 'fact' }
FOURCC_DATA = $61746164; { 'data' }
var
SysWaves: TSysWaves;
implementation
{$R *.dfm}
{*********************обработка формы SysWaves**********************************************}
//при создании формы и всей проги
procedure TSysWaves.FormShow(Sender: TObject);
var
v:variant;
begin
FRecorderMode := recModeOff;//режим рекордера устанавливаем 'нет режима записи'
//если функция "Разместите формат и заголовки волны, буфера данных, и временное имя файла" <> 0
if InitWaveRecorder <> 0 then Application.Terminate;//то завершить программу
//проверяет наличие файла config.ini
if FileExists(IncludeTrailingBackslash(ExtractFilePath(Application.ExeName))+'config.ini') then begin
//создает или открывает конфигурационный файл
ConfigFile:=TIniFile.Create(IncludeTrailingBackslash(ExtractFilePath(Application.ExeName))+'config.ini');
//проверяет наличие в config.ini разделов WaveFormat и DeviceMode, VolGain
if (ConfigFile.SectionExists('WaveFormat')=false) and (ConfigFile.SectionExists('DeviceMode')=false) and (ConfigFile.SectionExists('VolGain')=false) then begin
//принудительно устанавливает режим администратора
VarS.RadioButton1.Checked:=false;
VarS.RadioButton2.Checked:=true;
VarS.RadioButton1.Enabled:=false;
VarS.UserName.Enabled:=false;
end;
ConfigFile.Free;
end
else begin
//принудительно устанавливает режим администратора
VarS.RadioButton1.Checked:=false;
VarS.RadioButton2.Checked:=true;
VarS.RadioButton1.Enabled:=false;
VarS.UserName.Enabled:=false;
end;
//выбор прав и интерфейса
VarS.ShowModal;
try
//инициализируем ТAPI (интерфейс, устройства)
TAPILineService1.Active:=True;
TAPILine1.Active:=True;
TAPIAddress1.SetStatusMessages;
TAPIPhone1.Device.ID:= TAPILine1.Device.ID;
TAPIPhoneService1.Active:=true;
TAPIPhone1.Active:=true;
except
errormsg('Ошибка определения устройства типа модем');
Application.Terminate;
end;
//при выборе интерфейса - пользователь
if VarS.Tag=1 then begin
//установка заголовка формы и ее вида
SysWaves.Caption:='SysWave - пользователь';
TabSheet2.TabVisible:=false;
TabSheet3.TabVisible:=false;
//вывод на экран формата сжатия
FormatTagLabel.Caption := FFormatTag;
FormatDescLabel.Caption := FFormatDesc;
DisplayMemo.Clear;
LengthPosLabel.Caption := '0';
LengthDispLabel.Caption := '0';
DevName.Caption:=TAPILineDevice1.Caps.Name;//вывод на экран устройства типа модем
//загрузка настроек из config.ini
try
ConfigFile:=TIniFile.Create(IncludeTrailingBackslash(ExtractFilePath(Application.ExeName))+'config.ini');
//загрузка настроек устройства типа модем
FAutoAnswer:=ConfigFile.ReadBool('DeviceMode','AutoAnswer',true);
FPulse:=ConfigFile.ReadBool('DeviceMode','Pulse',true);
TAPIAddress1.NumRings:=ConfigFile.ReadInteger('DeviceMode','NumRings',0);
FTimeReg:=ConfigFile.ReadInteger('DeviceMode','TimeReg',0);
VG[1]:=ConfigFile.ReadInteger('VolGain','HeadSetVolume',50000);
VG[2]:=ConfigFile.ReadInteger('VolGain','HeadSetGain',50000);
VG[3]:=ConfigFile.ReadInteger('VolGain','HandSetVolume',50000);
VG[4]:=ConfigFile.ReadInteger('VolGain','HandSetGain',50000);
ConfigFile.Free;
except
errormsg('Ошибка загрузки конфигурации!');
Application.Terminate;
end;
if FAutoAnswer then Label4.Caption:='Авто'
else Label4.Caption:='Ручной'
end;
//при выборе интерфейса - администратор
if VarS.Tag=2 then begin
//установка заголовка формы и ее вида
SysWaves.Caption:='SysWave - администратор';
TabSheet1.TabVisible:=false;
ModemName.Caption:=TAPILineDevice1.Caps.Name;
//вывод на экран формата сжатия
GetFormatTag.Caption := FFormatTag;
GetFormatDesc.Caption := FFormatDesc;
TAPILineService1.Active:=false;
TAPILine1.Active:=false;
TAPIPhoneService1.Active:=false;
TAPIPhone1.Active:=false;
//загрузка настроек из config.ini
try
ConfigFile:=TIniFile.Create(IncludeTrailingBackslash(ExtractFilePath(Application.ExeName))+'config.ini');
RadioButton1.Checked:=ConfigFile.ReadBool('DeviceMode','AutoAnswer',true);
RadioButton2.Checked:= not RadioButton1.Checked;
CheckBox1.Checked:=ConfigFile.ReadBool('DeviceMode','Pulse',true);
MaskEdit1.Text:=ConfigFile.ReadString('DeviceMode','NumRings','0');
MaskEdit2.Text:=ConfigFile.ReadString('DeviceMode','TimeReg','0');
HeadSetVolUpDown.Position:=trunc(ConfigFile.ReadInteger('VolGain','HeadSetVolume',0)/2);
HeadSetGainUpDown.Position:=trunc(ConfigFile.ReadInteger('VolGain','HeadSetGain',0)/2);
HandSetVolUpDown.Position:=trunc(ConfigFile.ReadInteger('VolGain','HandSetVolume',0)/2);
HandSetGainUpDown.Position:=trunc(ConfigFile.ReadInteger('VolGain','HandSetGain',0)/2);
ConfigFile.Free;
except
errormsg('Ошибка загрузки конфигурации!');
Application.Terminate;
end;
end;
//открытие базы данных
Datamodule1.WavBase.Open;
if not Datamodule1.WavBase.Active then begin
errormsg('Ошибка открытия базы данных!');
Application.Terminate;
end;
end;
////////////////////////////////////////////////////////////////////////////
//при закрытии формы и всей проги
procedure TSysWaves.FormDestroy(Sender: TObject);
begin
//отключаем ТAPI (интерфейс, устройства)
TAPIPhoneService1.Active:=false;
TAPILineService1.Active:=false;
TAPILine1.Active:=false;
TAPIPhone1.Active:=false;
//если идет запись остановить ее
if FRecorderMode = recModeRecord then StopWaveRecord
//если идет проигрыш остановить его
else if FRecorderMode = recModePlay then StopWavePlay;
// Освобождение памяти, связанной с wav буферами.
DestroyWaveRecorder;
end;
//////////////////////////////////////////////////////////////////////////
//Вывод информациии о программе
procedure TSysWaves.About1Click(Sender: TObject);
begin
Abouts.ShowModal;
end;
////////////////////////////////////////////////////////////////////////////
//при нажатии Выход
procedure TSysWaves.exit1Click(Sender: TObject);
begin
close;
end;
{********************работа с модемом***************************************}
//при удаление устройства из системы
procedure TSysWaves.TAPILineDevice1StateReMoved(Sender: TObject);
begin
errormsg('Устройство было удалено из системы. Программа будет закрыта');
Application.Terminate;
end;
/////////////////////////////////////////////////////////////////////////////
//набор номера(запрос на соединение)
procedure TSysWaves.DialNoClick(Sender: TObject);
begin
DialNo.Enabled:=false;
CancelNo.Enabled:=true;
//проверка настройки тонального или импульсного набора номера
if FPulse then TAPIAddress1.OutboundCall.MakeCall(TAPILine1.Handle,'p'+ CallNo.Text,0)
else TAPIAddress1.OutboundCall.MakeCall(TAPILine1.Handle,'t'+ CallNo.Text,0)
end;
////////////////////////////////////////////////////////////////////////////
//отмена набора номера и соединения
procedure TSysWaves.CancelNoClick(Sender: TObject);
begin
Display('Идет отмена вызова...');
TAPICall1.Drop;//понижение статуса вызова
DialNo.Enabled:=true;
CancelNo.Enabled:=false
end;
/////////////////////////////////////////////////////////////////////////////
//при состоянии соединения модема с удаленным телефоном
procedure TSysWaves.TAPICall1StateConnected(Sender: TObject;
ConnectedMode: TLineConnectedModes; Rights: TLineCallPrivilege);
begin
Display('Соединение...');
TAPIPhone1.SpeakerHookSwitchMode:=phsmMicSpeaker;//включаем общую связь
TAPIPhone1.SpeakerVolume:=65000;
TAPIPhone1.SpeakerGain:=65000;
TAPIPhone1.HeadSetHookSwitchMode:=phsmMicSpeaker;//включаем наушники
TAPIPhone1.HandSetHookSwitchMode:=phsmMicSpeaker;//включаем микрофон
//установка громкости наушников и микрофона
TAPIPhone1.HeadSetVolume:=VG[1];
TAPIPhone1.HeadSetGain:=VG[2];
TAPIPhone1.HandSetGain:=VG[3];
TAPIPhone1.HandSetVolume:=VG[4];
//если идет запись
if FRecorderMode <> recModeOff then // остановить запись
StopWaveRecord
else begin
Display('Идет запись...');
//делаем записи в базе данных
Datamodule1.WavBase.Insert;
Datamodule1.WavBase.FieldByName('DateName').AsDateTime:=Date;//дата
Datamodule1.WavBase.FieldByName('TimeName').AsDateTime:=Time;//время
//имя пользователя
Datamodule1.WavBase.FieldByName('UserName').AsString:=VarS.UserName.Text;
FTimeCounter:=0;//обнуляем счетчик времени
StartWaveRecord; // начать запись
end;
end;
/////////////////////////////////////////////////////////////////////////////
//при состоянии разъединения модема с удаленным телефоном
procedure TSysWaves.TAPICall1StateDisconnected(Sender: TObject;
DisconnectedMode: TLineDisconnectMode; Rights: TLineCallPrivilege);
begin
Display('Соединение разорвано');
//если идет запись
if FRecorderMode <> recModeOff then //остановить запись
StopWaveRecord;
//если время разговора >= времени регистрации
if FTimeCounter >= FTimeReg then begin
SaveWaveFile;//сохранить файл с звуковыми данными
Datamodule1.WavBase.Post;//запись внесенных изменений в базу данных
end
else
Datamodule1.WavBase.Cancel;//отмена изменений внесенных в текущую запись
Answer.Enabled:=true;
HandsetDown.Enabled:=false;
TAPICall1.Drop;//понижение статуса запроса
end;
/////////////////////////////////////////////////////////////////////////////
//сообщение о наборе номера
procedure TSysWaves.TAPICall1StateProceeding(Sender: TObject;
Rights: TLineCallPrivilege);
begin
display('Идет набор номера ' + CallNo.Text);
end;
///////////////////////////////////////////////////////////////////////////////
//при состоянии звонка
procedure TSysWaves.TAPILineDevice1StateRinging(Sender: TObject;
RingModeIndex, RingCounter: Cardinal);
begin
display('Звонок...');
Windows.Beep(300, 500);//подача звукового сигнала через встроенный динамик
Windows.Beep(350, 500);
//если режим ответа модема - авто
if FAutoAnswer then begin
//если кол-во принятых звонков >= заданных
if RingCounter >= TAPIAddress1.NumRings then begin
Answer.Enabled:=false;
HandsetDown.Enabled:=true;
TAPIAddress1.InboundCall.Answer;//модем берет трубку
end;
end
end;
/////////////////////////////////////////////////////////////////////////
//при поступлении информации о входящем звонке
procedure TSysWaves.TAPICall1InfoCallerId(Sender: TObject);
begin
//если есть информация о входящем звонке
if TAPICall1.Info.CallerID <> '' then begin
display('Входящий звонок с номером' + TAPICall1.Info.CallerID);
end;
end;
////////////////////////////////////////////////////////////////////////////
//пользователь берет трубку
procedure TSysWaves.AnswerClick(Sender: TObject);
begin
Answer.Enabled:=false;
HandsetDown.Enabled:=true;
TAPIAddress1.InboundCall.Answer;//модем берет трубку
end;
////////////////////////////////////////////////////////////////////////////
//пользователь положил трубку
procedure TSysWaves.HandsetDownClick(Sender: TObject);
begin
Answer.Enabled:=true;
HandsetDown.Enabled:=false;
TAPICall1.Drop;//понижение статуса запроса
end;
////////////////////////////////////////////////////////////////////////////////
//отчистка набираемого номера
procedure TSysWaves.ClearNoClick(Sender: TObject);
begin
CallNo.Clear;
end;
//при состоянии поступления предложения запроса
procedure TSysWaves.TAPICall1StateOffering(Sender: TObject;
OfferingMode: TLineOfferingModes; Rights: TLineCallPrivilege);
begin
TAPIAddress1.InboundCall.Accept;// приложение примет контроль вызова
end;
//если запрос находится в неактивном состоянии
procedure TSysWaves.TAPICall1StateIdle(Sender: TObject;
Rights: TLineCallPrivilege);
begin
TAPICall1.DeallocateCall;
end;
//при состоянии занято
procedure TSysWaves.TAPICall1StateBusy(Sender: TObject;
BusyMode: TLineBusyMode; Rights: TLineCallPrivilege);
begin
TAPIAddress1.OutboundCall.Drop;
end;
//ответ модема
procedure TSysWaves.TAPICall1Reply(Sender: TObject; AsyncFunc: TAsyncFunc;
Error: Cardinal);
begin
if Error <> 0 then errormsg('Ошибка.Модем не может реагировать на запрос.');
if AsyncFunc =afDrop then TAPICall1.DeallocateCall;
end;
{***********************набор номера с клавиатура на экране******************************************}
procedure TSysWaves.SpeedButton1Click(Sender: TObject);
begin
CallNo.Text:=CallNo.Text + '1';
end;
procedure TSysWaves.SpeedButton2Click(Sender: TObject);
begin
CallNo.Text:=CallNo.Text + '2';
end;
procedure TSysWaves.SpeedButton3Click(Sender: TObject);
begin
CallNo.Text:=CallNo.Text + '3';
end;
procedure TSysWaves.SpeedButton4Click(Sender: TObject);
begin
CallNo.Text:=CallNo.Text + '4';
end;
procedure TSysWaves.SpeedButton5Click(Sender: TObject);
begin
CallNo.Text:=CallNo.Text + '5';
end;
procedure TSysWaves.SpeedButton6Click(Sender: TObject);
begin
CallNo.Text:=CallNo.Text + '6';
end;
procedure TSysWaves.SpeedButton7Click(Sender: TObject);
begin
CallNo.Text:=CallNo.Text + '7';
end;
procedure TSysWaves.SpeedButton8Click(Sender: TObject);
begin
CallNo.Text:=CallNo.Text + '8';
end;
procedure TSysWaves.SpeedButton9Click(Sender: TObject);
begin
CallNo.Text:=CallNo.Text + '9';
end;
procedure TSysWaves.SpeedButton10Click(Sender: TObject);
begin
CallNo.Text:=CallNo.Text + '0';
end;
procedure TSysWaves.SpeedButton11Click(Sender: TObject);
begin
CallNo.Text:=CallNo.Text + '*';
end;
procedure TSysWaves.SpeedButton12Click(Sender: TObject);
begin
CallNo.Text:=CallNo.Text + '#';
end;
{******************Работа со звуком****************************************}
//=========================инициализация===================================
//Размещение формата и заголовков wav, буфера данных, и получение временного имени файла
function TSysWaves.InitWaveRecorder : integer;
var
Temp : array [0..MAX_PATH] of char;
begin
Result := -1;
// размещение в памяти структуры формата wav...
if AllocWaveFormatEx <> 0 then
Exit;
// размещение в памяти заголовка wav...
if AllocWaveHeader <> 0 then begin
Result := -3;
Exit;
end;
// размещение в памяти буфера данных wav
if AllocPCMBuffers <> 0 then begin
Result := -4;
Exit;
end;
//Генирируем имя временного файла
GetTempPath(sizeof(Temp), Temp);
SetLength(FTmpFileName, MAX_PATH);
GetTempFileName(Temp, 'wr', 0, PChar(FTmpFileName));
Result := 0;
end;
////////////////////////////////////////////////////////////////////////////
//Размещение и захват структуры WAVEFORMATEX, основанной на максимальном размере
//формата согласно ACM.
function TSysWaves.AllocWaveFormatEx : Integer;
var
v:variant;
begin
//если не получен наибольший размер формата, требуемый от установленного ACM...
if acmMetrics(nil, ACM_METRIC_MAX_SIZE_FORMAT, FMaxFmtSize) <> 0 then begin
errormsg('Ошибка получения размера максимального формата сжатия .');
Result := -1;
Exit;
end;
//выделение памяти
GetMem(FWaveFormat, FMaxFmtSize);
//если формат неопределен
if FWaveFormat = nil then begin
errormsg('Ошибка размещения в памяти WaveFormatEx структуры.');
Result := -2;
Exit;
end;
//обнуление структуры FWaveFormat
FillChar(FWaveFormat^, FMaxFmtSize, 0);
//загрузка настроек звукового формата из config.ini
try
ConfigFile:=TIniFile.Create(IncludeTrailingBackslash(ExtractFilePath(Application.ExeName))+'config.ini');
FWaveFormat.wFormatTag:=ConfigFile.ReadInteger('WaveFormat','FormatTag',WAVE_FORMAT_PCM);
FWaveFormat.nChannels:=ConfigFile.ReadInteger('WaveFormat','Channels',1);
v:=ConfigFile.ReadInteger('WaveFormat','SamplesPerSec',8000);
FWaveFormat.nSamplesPerSec:=v;
v:=ConfigFile.ReadInteger('WaveFormat','AvgBytesPerSec',8000);
FWaveFormat.nAvgBytesPerSec:=v;
FWaveFormat.nBlockAlign:=ConfigFile.ReadInteger('WaveFormat','BlockAlign',1 );
FWaveFormat.wBitsPerSample:=ConfigFile.ReadInteger('WaveFormat','BitsPerSample',16);
FWaveFormat.cbSize:=ConfigFile.ReadInteger('WaveFormat','Size',0);
ConfigFile.Free;
except
errormsg('Ошибка загрузки конфигурации!');
Application.Terminate;
end;
// сохранить формат и теги строки описания
GetFormatTagDetails(FWaveFormat.wFormatTag);
GetFormatDetails(FWaveFormat);
Result := 0;
end;
////////////////////////////////////////////////////////////////////////////
// Получение подробности формата, и сохранение строкового описания.
function TSysWaves.GetFormatDetails(pfmtin : PWAVEFORMATEX) : integer;
var
acmfmtdetails : TACMFORMATDETAILS;
begin
//обнуление структуру acmfmtdetails
FillChar(acmfmtdetails, sizeof(acmfmtdetails), 0);
acmfmtdetails.cbStruct := sizeof(acmfmtdetails);
acmfmtdetails.pwfx := pfmtin;
acmfmtdetails.dwFormatTag := pfmtin.wFormatTag;
acmfmtdetails.cbwfx := sizeof(TWAVEFORMATEX) + pfmtin.cbSize;
//если запрос о сведении формата <> 0 то FormatDetails функция потерпела неудачу
if acmFormatDetails(nil, acmfmtdetails, ACM_FORMATDETAILSF_FORMAT) <> 0 then begin
errormsg('Ошибка, FormatDetails не работает');
Result := -1;
Exit;
end;
// сохранение строки описания деталей формата...
FFormatDesc := acmfmtdetails.szFormat;
Result := 0;
end;
////////////////////////////////////////////////////////////////////////////
// размещение в памяти заголовка wave
function TSysWaves.AllocWaveHeader : integer;
var
i : Integer;
begin
for i := Low(FWaveHdr) to High(FWaveHdr) do begin
GetMem(FWaveHdr[i], sizeof(TWAVEHDR));//выделяем память под заголовок
//если заголовок не определен
if FWaveHdr[i] = nil then begin
errormsg('Ошибка размещения в памяти заголовка wave.');
Result := -1;
Exit;
end;
end;
Result := 0;
end;
/////////////////////////////////////////////////////////////////////////////
//размещение wave буфера в памяти
function TSysWaves.AllocPCMBuffers : Integer;
var
i : Integer;
begin
for i := Low(FWaveMem) to High(FWaveMem) do begin
GetMem(FWaveMem[i], WAVE_BUFSIZE);//выделяем память под wav буфер
//если wav буфер не определен
if FWaveMem[i] = nil then begin
errormsg('Ошибка размещения wave буфера в памяти.');
Result := -1;
Exit;
end;
FWaveHdr[i].lpData := FWaveMem[i];
end;
Result := 0;
end;
/////////////////////////////////////////////////////////////////////////////
//========================завершение============================================
//Освобождение памяти, связанной с буферами wav
procedure TSysWaves.DestroyWaveRecorder;
begin
FreeWaveFormatEx;// Освобождение памяти от структуры WAVEFORMATEX
FreePCMBuffers;//Освобождение памяти от wav буферов.
FreeWaveHeader;//Освобождение памяти заголовка wav.
DeleteTmpFile;//Удаление временного файла
end;
////////////////////////////////////////////////////////////////////////////
//Освобождение памяти от структуры WAVEFORMATEX
procedure TSysWaves.FreeWaveFormatEx;
begin
//если FWaveFormat не является неопределенной
if FWaveFormat <> nil then begin
FreeMem(FWaveFormat);
FWaveFormat := nil;
end;
end;
////////////////////////////////////////////////////////////////////////////
//Освобождение памяти wav буферов.
procedure TSysWaves.FreePCMBuffers;
var
i : Integer;
begin
for i := Low(FWaveMem) to High(FWaveMem) do begin
if FWaveMem[i] <> nil then begin
FreeMem(FWaveMem[i]);
FWaveMem[i] := nil;
end;
end;
end;
/////////////////////////////////////////////////////////////////////////////
//Освобождение памяти заголовка wav.
procedure TSysWaves.FreeWaveHeader;
var
i : Integer;
begin
for i := Low(FWaveHdr) to High(FWaveHdr) do begin
if FWaveHdr[i] <> nil then begin
FreeMem(FWaveHdr[i]);
FWaveHdr[i] := nil;
end;
end;
end;
//==============работа с временым файлом========================================
//Создание временного файла чтобы писать wav данные.
function TSysWaves.CreateTmpFile : integer;
var
RootPathName : array [0..MAX_PATH] of char;
SectorsPerCluster : DWORD;
BytesPerSector : DWORD;
NumberOfFreeClusters : DWORD;
TotalNumberOfClusters : DWORD;
begin
FTmpFileHandle := _lcreat(PChar(FTmpFileName), 0);//получение дескриптора
//временного файла и его создание
//если произошла ошибка создания временого файла
if FTmpFileHandle = HFILE_ERROR then begin
errormsg('Ошибка создания временого файла');
Result := -1;
Exit;
end;
// получение доступного пространства на временном диске...
//если в полном имени файла есть знак ':'
if FTmpFileName[2] = ':' then
//то имя диска определяется так
RootPathName[0] := FTmpFileName[1]
else //иначе
//получение текущей дериктории
GetCurrentDirectory(sizeof(RootPathName), @RootPathName);
RootPathName[1] := ':';
RootPathName[2] := '\';
RootPathName[3] := #0;
//получение свободного места на диске
GetDiskFreeSpace(@RootPathName,
SectorsPerCluster,
BytesPerSector,
NumberOfFreeClusters,
TotalNumberOfClusters);
//FDiskFreeSpace = кол-во Свободных Кластеров * секторов в кластере
FDiskFreeSpace := NumberOfFreeClusters * SectorsPerCluster;
// FDiskFreeSpace = кол-во Свободных секторов * байт в секторе
FDiskFreeSpace := FDiskFreeSpace * BytesPerSector;
Result := 0;
end;
////////////////////////////////////////////////////////////////////////////
// Закройте временный файл содержащий недавно записаные данные.
procedure TSysWaves.CloseTmpFile;
begin
if _lclose(FTmpFileHandle) = HFILE_ERROR then
errormsg('Ошибка закрытия временного файла');
end;
//////////////////////////////////////////////////////////////////////////////
// Удалите временный файл
procedure TSysWaves.DeleteTmpFile;
begin
//если длина временного файла > 0
if Length(FTmpFileName) > 0 then
DeleteFile(FTmpFileName);//удалить файл
end;
////////////////////////////////////////////////////////////////////////////
// Откройте временный файл для чтения.
function TSysWaves.OpenTmpFile : Integer;
begin
// Открываем временный файл для чтения.
FTmpFileHandle := _lopen(PChar(FTmpFileName), OF_READ);
//если произошла ошибка открытия временного файла
if FTmpFileHandle = HFILE_ERROR then
Result := 0
else
Result := 1;
end;
//==================работа с записью============================================
// Остановка записи
procedure TSysWaves.StopWaveRecord;
var
v:variant;
begin
FRecorderMode := recModeOff;//устанавливаем режим рекордера - выключен
//Функция waveInReset останавливает операцию загрузки данных.
//Все текущие буферы отмечаются как обработанные и приложение уведомляется
//о завершении загрузки данных
if waveInReset(FWaveIn) <> 0 then
errormsg('Ошибка остановки записи');
CloseWaveDeviceRecord;//закрытие устройства записи
Timer3.Enabled := FALSE;// стоп таймер
end;
////////////////////////////////////////////////////////////////////////////
// Подготовка заголовков, добавление буфера, подготовка показа, и начало записи.
function TSysWaves.StartWaveRecord : Integer;
var
Status : MMRESULT;
Flags:DWord;
WaveInCaps:PWaveInCaps;
begin
//обнуляем номер записанных выборок, размер записаных данных и номер буфера
FTotalWaveSize := 0;
FByteDataSize := 0;
FBufIndex := 0;
//получаем номер открываемого устройства типа модем
FWaveInID :=TAPICall1.GetWaveID('wave/in');
//если номер открываемого устройства равен полученному автоматически то
if FWaveInID= Wave_Mapper then
Flags:=WAVE_FORMAT_QUERY//устанавливаем флаг , чтобы функция запрашивала
//устройство для определения, поддерживает ли оно указанный формат, но не открывала его;
else
Flags:=WAVE_FORMAT_QUERY or WAVE_MAPPED;
Status := waveInOpen(@FWaveIn, FWaveInID, FWaveFormat,
0, 0, Flags);
if Status <> MMSYSERR_NOERROR then begin
errormsg('Ошибка открытия устройства ввода данных для записи.');
Result := -1;
Exit;
end;
if FWaveInID = Wave_Mapper then Flags:=CALLBACK_WINDOW
else
Flags:=CALLBACK_WINDOW or WAVE_MAPPED;
Status := waveInOpen(@FWaveIn, FWaveInID, FWaveFormat,
HWND(SysWaves.Handle), 0, Flags);
if Status <> MMSYSERR_NOERROR then begin
errormsg(' Ошибка открытия устройства ввода данных для записи.');
Result := -1;
Exit;
end;
//устанавливаем признак открытия устройства
FDeviceOpened := TRUE;
// Обнуляем заголовки wav и инициализируем указатели данных и буферные длины
InitWaveHeaders;
//если подготовка буферов для операции загрузки данных не успешна
if not ((waveInPrepareHeader(FWaveIn, FWaveHdr[0], sizeof(TWAVEHDR)) = 0) and
(waveInPrepareHeader(FWaveIn, FWaveHdr[1], sizeof(TWAVEHDR)) = 0))
then begin
CloseWaveDeviceRecord;//закрыть устройство
errormsg('Ошибка подготовки заголовка для записи.');
Result := -2;
Exit;
end;
// добавляем первый буфер...
if AddNextBuffer <> 0 then begin
Result := -3;
Exit;
end;
//Создаем временный файл, в который мы будем писать...
if CreateTmpFile <> 0 then begin
CloseWaveDeviceRecord;//закрыть устройство
Result := -4;
Exit;
end;
// запускаем начало записи
if waveInStart(FWaveIn) <> 0 then begin
CloseWaveDeviceRecord;//закрыть устройство
errormsg('Ошибка начала записи.');
Result := -5;
Exit;
end;
FRecorderMode := recModeRecord;//режим рекордера - запись
// установка таймера чтобы модифицировать дисплей...
Timer3.Interval := 1000;
Timer3.Enabled := TRUE;
UpdateLength(0, FDiskFreeSpace);
//добавляем в очередь следующий буфер...
if AddNextBuffer <> 0 then begin
Result := -6;
Exit;
end;
Result := 0;
end;
////////////////////////////////////////////////////////////////////////////////
// Обнуляем заголовки wav и инициализируем указатели данных и буферные длины
procedure TSysWaves.InitWaveHeaders;
begin
// делаем размер буфера , который выравнивает множитель блока ...
FWaveBufSize := (WAVE_BUFSIZE - WAVE_BUFSIZE mod FWaveFormat.nBlockAlign);
// обнулить заголовки wav
FillChar(FWaveHdr[0]^, sizeof(TWAVEHDR), 0);
FillChar(FWaveHdr[1]^, sizeof(TWAVEHDR), 0);
// теперь инициализируем указатели данных и буферные длины...
FWaveHdr[0].dwBufferLength := FWaveBufSize;
FWaveHdr[1].dwBufferLength := FWaveBufSize;
FWaveHdr[0].lpData := FWaveMem[0];
FWaveHdr[1].lpData := FWaveMem[1];
end;
///////////////////////////////////////////////////////////////////////////////
//Закрытие временного файла и устройства, делающего запись.
procedure TSysWaves.CloseWaveDeviceRecord;
begin
// если устройство уже закрыто, возвращаться...
if not FDeviceOpened then Exit;
//освобождение памяти занимаемой заголовком1...
if waveInUnprepareHeader(FWaveIn, FWaveHdr[0], sizeof(TWAVEHDR)) <> 0 then
errormsg('Ошибка в waveInUnprepareHeader (1)');
//освобождение памяти занимаемой заголовком2...
if waveInUnprepareHeader(FWaveIn, FWaveHdr[1], sizeof(TWAVEHDR)) <> 0 then
errormsg('Ошибка в waveInUnprepareHeader (2)');
// сохранение зарегистрированого полного размера зап. данных, и обновление дисплея
FTotalWaveSize := FByteDataSize;
UpdateLength(FTotalWaveSize, FDiskFreeSpace);
//признак записи данных
FRecordedData := TRUE;
// закрыть временый файл
CloseTmpFile;
// закрыть wav устройство
if waveInClose(FWaveIn) <> 0 then errormsg('Ошибка закрытия устройства входа');
//признак открытия устройства
FDeviceOpened := FALSE;
// обновление дисплея
Display('Запись остановлена');
end;
//////////////////////////////////////////////////////////////////////////////
//Обновление на экране числа записанных байт
procedure TSysWaves.UpdateLength(BytePosition : DWORD; BytePositiontotal : DWORD);
var
v:variant;
begin
LengthPosLabel.Caption := IntToStr(BytePosition);//число байт
LengthDispLabel.Caption := IntToStr(BytePositiontotal);//позиция
end;
//////////////////////////////////////////////////////////////////////////////
// Добавление буфера к очереди и переключение индекса буфера
function TSysWaves.AddNextBuffer : integer;
begin
//ставит в очередь на загрузку данными буфер памяти
if waveInAddBuffer(FWaveIn, FWaveHdr[FBufIndex], sizeof(TWAVEHDR)) <> 0 then begin
StopWaveRecord;
errormsg('Ошибка добавления буфера.');
Result := -1;
Exit;
end;
// переключение индекса для следующего буфера...
FBufIndex := 1 - FBufIndex;
Result := 0;
end;
///////////////////////////////////////////////////////////////////////////
//обновления количества записанных байтов
procedure TSysWaves.UpdateRecordDisplay;
var
mmtime : TMMTIME;
begin
mmtime.wType := TIME_BYTES;
//Функция восстанавливает текущее положение{позицию} данного звукового устройства
waveInGetPosition(FWaveIn, @mmtime, sizeof(mmtime));
UpdateLength(mmtime.cb, FDiskFreeSpace);//Обновление на экране числа записанных байт
FTotalWaveSize:=mmtime.cb;//накапливает максимальный размер
end;
//================сохранение файла==============================================
// Сохранение wav файла
function TSysWaves.SaveWaveFile : Integer;
var
mmfp : HMMIO;
dwTotalSamples : DWORD;
fTotalSamples : double;
mminfopar : TMMCKINFO;
mminfosub : TMMCKINFO;
GetDT : TSystemTime;
str : string;
begin
// если никакие данные не зарегистрированы ,то выход
if FTotalWaveSize = 0 then begin
errormsg('Не записаны звуковые данные чтобы сохранить их.');
Result := 0;
Exit;
end;
//получение имени файла
DateTimeToSystemTime(Now,GetDT);
with GetDT do begin
Datamodule1.WavBase.FieldByName('FileName').AsString:=IntToStr(Integer(wYear))+
IntToStr(Integer(wMonth))+IntToStr(Integer(wDay))+IntToStr(Integer(wHour))+
IntToStr(Integer(wMinute))+IntToStr(Integer(wSecond))+'.wav';
FFilename:=IncludeTrailingBackslash(ExtractFilePath(Application.ExeName))+
'WavBase\'+ Datamodule1.WavBase.FieldByName('FileName').AsString;
end;
// откройте wav файл для записи...
mmfp := mmioOpen(PChar(FFilename), nil,
MMIO_CREATE or MMIO_WRITE or MMIO_ALLOCBUF);
//если произошла ошибка открытия файла, то
if mmfp = 0 then begin
errormsg('Ошибка открытия файла для записи.');
Result := -1;
Exit;
end;
Cursor := crHourGlass;
// создайте wav кусок RIFF
mminfopar.fccType := FOURCC_WAVE;
mminfopar.cksize := 0;//пусть функция определит размер
//если создание куска неудачно
if mmioCreateChunk(mmfp, @mminfopar, MMIO_CREATERIFF) <> 0 then begin
WFerror(mmfp, 'Ошибка создания RIFF wave куска.');
Result := -2;
Exit;
end;
//создайте кусок формата, и запишите wav формат...
mminfosub.ckid := FOURCC_FMT;
mminfosub.cksize := FMaxFmtSize;
//если создание куска неудачно
if mmioCreateChunk(mmfp, @mminfosub, 0) <> 0 then begin
WFerror(mmfp, 'Ошибка создания RIFF формата куска.');
Result := -3;
Exit;
end;
//если ошибка записи RIFF
if mmioWrite(mmfp, PChar(FWaveFormat), FMaxFmtSize) <> LongInt(FMaxFmtSize) then begin
WFerror(mmfp, 'Ошибка записи RIFF формата данных.');
Result := -3;
Exit;
end;
// назад из куска формата...
mmioAscend(mmfp, @mminfosub, 0);
// этот кусок только содержит полную длину в выборках...
mminfosub.ckid := FOURCC_FACT;
mminfosub.cksize := sizeof(DWORD);
//если создание куска неудачно
if mmioCreateChunk(mmfp, @mminfosub, 0) <> 0 then begin
WFerror(mmfp, 'Ошибка создания RIFF ''фактического'' куска.');
Result := -4;
Exit;
end;
fTotalSamples := FTotalWaveSize / FWaveFormat.nAvgBytesPerSec *
FWaveFormat.nSamplesPerSec;
dwTotalSamples := Trunc(fTotalSamples);
//если ошибка записи RIFF
if mmioWrite(mmfp, PChar(@dwTotalSamples), sizeof(dwTotalSamples))
<> sizeof(dwTotalSamples) then begin
WFerror(mmfp, 'Ошибка записи RIFF ''фактических'' данных.');
Result := -4;
Exit;
end;
// назад из куска факта...
mmioAscend(mmfp, @mminfosub, 0);
// теперь создайте, и запишите wav кусок данных...
mminfosub.ckid := FOURCC_DATA;
mminfosub.cksize := 0;// пусть функция определяет размер
//если создание куска неудачно
if mmioCreateChunk(mmfp, @mminfosub, 0) <> 0 then begin
WFerror(mmfp, 'Ошибка создания RIFF куска данных.');
Result := -5;
Exit;
end;
// копируйте данные из временного файла в wav файл
if CopyDataToWaveFile(mmfp) <> 0 then begin
WFerror(mmfp, 'Ошибка записи wave данных.');
Result := -5;
Exit;
end;
mmioAscend(mmfp, @mminfosub, 0);
// поднимитесь из куска RIFF...
mmioAscend(mmfp, @mminfopar, 0);
//закрыть
mmioClose(mmfp, 0);
Cursor := crDefault;
Result := 0;
end;
/////////////////////////////////////////////////////////////////////////////
// Закрытие wav файла, вывод сообщения об ошибках
procedure TSysWaves.WFerror(
mmfp : HMMIO;
const msg : String);
begin
mmioClose(mmfp, 0);
Cursor := crDefault;
errormsg(msg);
end;
///////////////////////////////////////////////////////////////////////////
// Копирование wav данных из временного файла в wav файл
function TSysWaves.CopyDataToWaveFile(mmfp : HMMIO) : integer;
var
pbuf : PChar;
ht : HFILE;
nbytes : integer;
begin
pbuf := FWaveMem[0]; //используйте один из волновых буферов для копирования
// откройте временный файл для чтения
ht := _lopen(PChar(FTmpFileName), OF_READ);
//если произошла ошибка открытия файла
if ht = HFILE_ERROR then begin
Result := -1;
Exit;
end;
// копируйте в RIFF/wave файл
while TRUE do begin
nbytes := _lread(ht, pbuf, WAVE_BUFSIZE);
if nbytes <= 0 then break;
mmioWrite(mmfp, pbuf, nbytes);
end;
// закройте файл чтения
_lclose(ht);
Result := 0;
end;
//======================получение и установка кодеков=====================================
//функция вызывающая визуальный выбор кодека
function TSysWaves.GetWaveFormat : integer;
var
acmopt : TACMFORMATCHOOSE;
err : MMRESULT;
ptmpfmt : PWAVEFORMATEX;
begin
//размещение структуры ptmpfmt в динамич памяти
GetMem(ptmpfmt, FMaxFmtSize);
//если структура не определена
if ptmpfmt = nil then begin
errormsg('Ошибка распределения временного буфера формата.');
Result := -1;
Exit;
end;
//Переместите байты размером FMaxFmtSize из FWaveFormat^ в ptmpfmt^
Move(FWaveFormat^, ptmpfmt^, FMaxFmtSize);
// ACM установка выбирает поля и отображает диалог...
//заполняет нулями acmopt
FillChar(acmopt, sizeof(acmopt), 0);
//заносим предварительные данные
acmopt.cbStruct := sizeof(acmopt);//размер области памяти, занимаемой структурой.
acmopt.fdwStyle := ACMFORMATCHOOSE_STYLEF_INITTOWFXSTRUCT;//флаги стилей
//построения диалога
acmopt.hwndOwner := Handle;//ключ окна-владельца создаваемого диалога
acmopt.pwfx := FWaveFormat;//указатель области памяти для структуры типа
//WAVEFORMATEX
acmopt.cbwfx := FMaxFmtSize;//размер области памяти для структуры описания
//формата
acmopt.pszTitle := 'Выбор кодека';
acmopt.fdwEnum := ACM_FORMATENUMF_INPUT;//флаги режимов перебора фильтров/форматов.
err := acmFormatChoose(acmopt);//выбираем кодек
//сравниваем полученную и предыдущую структуру TWAVEFORMATEX
if CompareMem(FWaveFormat, ptmpfmt, sizeof(TWAVEFORMATEX)) then
err := ACMERR_CANCELED; //пользователь закрыл диалог кнопкой Cancel
if err <> MMSYSERR_NOERROR then begin
//Переместите байты размером FMaxFmtSize из ptmpfmt^ в FWaveFormat^
Move(ptmpfmt^, FWaveFormat^, FMaxFmtSize);
FreeMem(ptmpfmt);//освобождаем память
if err = ACMERR_CANCELED then begin
Result := 0;
Exit;
end;
errormsg('Ошибка функции FormatChoose');
Result := -2;
Exit;
end;
//запомнить описание формата...его характеристики
FFormatDesc := acmopt.szFormat;
GetFormatTagDetails(acmopt.pwfx.wFormatTag);
FreeMem(ptmpfmt);//освобождаем память
Result := 0;
end;
/////////////////////////////////////////////////////////////////////////////
// Получение подробности тэга формата, и сохранение строкового описания.
function TSysWaves.GetFormatTagDetails(wFormatTag : WORD) : integer;
var
acmtagdetails : TACMFORMATTAGDETAILS;
begin
// обнулить....
FillChar(acmtagdetails, sizeof(acmtagdetails), 0);
acmtagdetails.cbStruct := sizeof(acmtagdetails);
acmtagdetails.dwFormatTag := wFormatTag;
//если запрос о сведении типа формата <> 0 то
if acmFormatTagDetails(nil, acmtagdetails,
ACM_FORMATTAGDETAILSF_FORMATTAG) <> 0 then begin
errormsg('Ошибка функции FormatTagDetails');
Result := -1;
Exit;
end;
//сохраните строку описания деталей формата...
FFormatTag := acmtagdetails.szFormatTag;
Result := 0;
end;
//===================проигрывание звука=========================================
//Чтение волнового файла
function TSysWaves.ReadWaveFile : Integer;
var
mmfp : HMMIO;
mminfopar : TMMCKINFO;
mminfosub : TMMCKINFO;
dwTotalSamples : DWORD;
Sec,Min:variant;
begin
dwTotalSamples:=0;
//получаем имя проигрываемого файла
FFileName:= IncludeTrailingBackslash(ExtractFilePath(Application.ExeName)) +
'WavBase\'+ datamodule1.WavBase.FieldByName('FileName').AsString;
// открыть wave файл для чтения...
mmfp := mmioOpen(PChar(FFileName), nil, MMIO_READ + MMIO_ALLOCBUF);
//если файл не открыт
if mmfp = 0 then begin
errormsg('Ошибка открытия файла для чтения.');
Result := -1;
Exit;
end;
Cursor := crHourGlass;
// поиск куска формата...
mminfopar.fccType := FOURCC_WAVE;
if mmioDescend(mmfp, @mminfopar, nil, MMIO_FINDRIFF) <> 0 then begin
WFerror(mmfp, 'Wave формат не найден в файле.');
Result := -2;
Exit;
end;
mminfosub.ckid := FOURCC_FMT;
if mmioDescend(mmfp, @mminfosub, @mminfopar, MMIO_FINDCHUNK) <> 0 then begin
WFerror(mmfp, 'Формат куска не найден.');
Result := -3;
Exit;
end;
//если размер wav формата > максимального размера ACM
if mminfosub.cksize > FMaxFmtSize then begin
WFerror(mmfp, 'Размер формата в файле не соответствует типам ACM.');
Result := -4;
Exit;
end;
// читайте wav формат....
if mmioRead(mmfp, PChar(FWaveFormat), mminfosub.cksize)
<> LongInt(mminfosub.cksize) then begin
WFerror(mmfp, 'Ошибка чтения куска формата.');
Result := -4;
Exit;
end;
//назад
mmioAscend(mmfp, @mminfosub, 0);
//поиск 'фактического'' куска
mminfosub.ckid := FOURCC_FACT;
if mmioDescend(mmfp, @mminfosub, @mminfopar, MMIO_FINDCHUNK) <> 0 then begin
WFerror(mmfp, 'Ошибка поиска RIFF ''фактического'' куска.');
Result := -7;
Exit;
end;
//чтение ''фактических'' данных
if mmioRead(mmfp, PChar(@dwTotalSamples), mminfosub.cksize)
<> LongInt(mminfosub.cksize) then begin
WFerror(mmfp, 'Ошибка чтения RIFF ''фактических'' данных.');
Result := -7;
Exit;
end;
//получение общего времени проигрывания файла
min:=0;
Sec:=dwTotalSamples/FWaveFormat.nSamplesPerSec ;
trackbar1.Max:= trunc(Sec);
if Sec/60 < 1 then Sec:=trunc(Sec)
else begin
Min:=trunc(Sec/60);
Sec:=trunc((Sec/60-Min)*60);
end;
Label10.Caption:=Format('%.2d:%.2d',[integer(Min),integer(Sec)]);
// назад из куска факта...
mmioAscend(mmfp, @mminfosub, 0);
// получите полный wav размер данных (mminfo.cksize)..
mminfosub.ckid := FOURCC_DATA;
if mmioDescend(mmfp, @mminfosub, @mminfopar, MMIO_FINDCHUNK) <> 0 then begin
WFerror(mmfp, 'Кусок данных не найден.');
Result := -5;
Exit;
end;
// если нет никаких данных,
if mminfosub.cksize = 0 then begin
WFerror(mmfp, 'Кусок данных не содержит никаких данных.');
Result := -6;
Exit;
end;
// теперь читайте wav данные и копируйте во временный файл...
if CopyWaveToTempFile(mmfp, mminfosub.cksize) <> 0 then begin
mminfosub.cksize := 0;
errormsg('Ошибка чтения wave данных.');
end;
//закрытие wav файл
mmioClose(mmfp, 0);
Cursor := crDefault;
FTotalWaveSize := mminfosub.cksize;
// признак записи данных
FRecordedData := FALSE;
// сохраните формат и тег описание строки...
GetFormatTagDetails(FWaveFormat.wFormatTag);
GetFormatDetails(FWaveFormat);
FTLabel.Caption := FFormatTag;
FDLabel.Caption := FFormatDesc;
Result := 0;
end;
/////////////////////////////////////////////////////////////////////////////
// Копируйте данные волны из файла RIFF в временый файл.
function TSysWaves.CopyWaveToTempFile(mmfp: HMMIO;datasize : DWORD) : Integer;
var
pbuf : PChar;
ntotal : DWORD;
nbytes : integer;
readsize : DWORD;
begin
pbuf := FWaveMem[0];
readsize := WAVE_BUFSIZE;
ntotal := 0;
Result := 0;
// создайте временный файл, основанный на текущем временном имени
if CreateTmpFile <> 0 then begin
Result := -1;
Exit;
end;
//введите чтение/копирование цикл
while ntotal < datasize do begin
if (ntotal + readsize) > datasize then readsize := datasize - ntotal;
nbytes := mmioRead(mmfp, pbuf, readsize);
if nbytes = 0 then begin
Result := -2;
break;
end;
if _lwrite(FTmpFileHandle, pbuf, nbytes) <> UINT(nbytes) then begin
Result := -3;
break;
end;
Inc(ntotal, nbytes);
end;
// закройте файл чтения...
CloseTmpFile;
end;
////////////////////////////////////////////////////////////////////////////
//Подготовка заголовков, добавьте буфер, и начните делать запись.
function TSysWaves.StartWavePlay : Integer;
begin
FByteDataSize := 0;
FBufIndex := 0;
// откройте устройство для регистрации(записи)...
if waveOutOpen(@FWaveOut, WAVE_MAPPER, FWaveFormat,
Handle, 0, CALLBACK_WINDOW or WAVE_ALLOWSYNC) <> 0 then begin
errormsg('Ошибка открытия устройства проигрывания.');
Result := -1;
Exit;
end;
FDeviceOpened := TRUE;
// подготовка заголовков...
InitWaveHeaders;
if (waveOutPrepareHeader(FWaveOut, FWaveHdr[0], sizeof(TWAVEHDR)) <> 0) or
(waveOutPrepareHeader(FWaveOut, FWaveHdr[1], sizeof(TWAVEHDR)) <> 0)
then begin
CloseWaveDevicePlay;
errormsg('Ошибка подготовки заголовков для проигрывания.');
Result := -2;
Exit;
end;
// откройте временный файл для чтения...
if OpenTmpFile = 0 then begin
CloseWaveDevicePlay;
errormsg('Ошибка открытия временного файла для чтения');
Result := -3;
Exit;
end;
// запишите первый буфер, чтобы запустить играть..
if QueueNextBuffer <> 0 then begin
CloseWaveDevicePlay;
Result := -4;
Exit;
end;
FRecorderMode := recModePlay;
FMoreToPlay := TRUE;
// установите таймер чтобы модифицировать дисплей....
Timer1.Interval := 1000;
Timer1.Enabled := TRUE;
// и очередь следующий буфер..
QueueNextBuffer;
Result := 0;
end;
////////////////////////////////////////////////////////////////////////////
// закрытие устройства проигрывания
procedure TSysWaves.CloseWaveDevicePlay;
begin
//освобождение памяти заголовков
if (waveOutUnprepareHeader(FWaveOut, FWaveHdr[0], sizeof(TWAVEHDR)) <> 0) or
(waveOutUnprepareHeader(FWaveOut, FWaveHdr[1], sizeof(TWAVEHDR)) <> 0)
then errormsg('Ошибка работы с заголовками.');
// закрыть устройство
if waveOutClose(FWaveOut) <> 0 then
errormsg('Ошибка закрытия устройства для проигрывания.');
FDeviceOpened := FALSE;
// закрыть временый файл
CloseTmpFile;
Play.Caption:='Играть';
Select.Enabled:=true;
NoSelect.Enabled:=true;
DelTrack.Enabled:=true;
TrackBar1.Position:=0;
Play.Enabled:=true;
Stop.Enabled:=false;
Label10.Caption :=Format('%.2d:%.2d',[0,0]);
Label11.Caption :=Format('%.2d:%.2d',[0,0]);
end;
////////////////////////////////////////////////////////////////////////////
// Запись из буфера в устройство проигрывания и переключение индекса буфера .
function TSysWaves.QueueNextBuffer : Integer;
begin
// заполните волновой буфер данными от файла...
if ReadWaveBuffer = 0 then begin
// сбросьте поля признака (удалите атрибут WHDR_DONE)...
FWaveHdr[FBufIndex].dwFlags := WHDR_PREPARED;
// теперь очередь буфер для вывода...
if waveOutWrite(FWaveOut, FWaveHdr[FBufIndex], sizeof(TWAVEHDR)) <> 0
then begin
StopWavePlay;
errormsg('Ошибка записи wave буфера.');
Result := -1;
Exit;
end;
// переключите для следующего буфера...
FBufIndex := 1 - FBufIndex;
end;
Result := 0;
end;
////////////////////////////////////////////////////////////////////////////
// Читайте кусок wav из временного файла
function TSysWaves.ReadWaveBuffer : Integer;
begin
// если мы не столкнулись с концом wav , читайте другой буфер
if FByteDataSize < FTotalWaveSize then begin
// читайте кусок wav из временного файла
FWaveHdr[FBufIndex].dwBufferLength :=
_lread(FTmpFileHandle, FWaveMem[FBufIndex], FWaveBufSize);
// модифицируйте общее количество байтов чтения
Inc(FByteDataSize, FWaveHdr[FBufIndex].dwBufferLength);
Result := 0;
Exit;
end;
FMoreToPlay := FALSE; // обработанный в MM_WOM_DONE сообщении
Result := 1;
end;
////////////////////////////////////////////////////////////////////////////
//стоп проигывание wav файла
procedure TSysWaves.StopWavePlay;
begin
// если устройство не является открытым, возвращаться...
if not FDeviceOpened then Exit;
// стоп игра
waveOutReset(FWaveOut);
// стоп таймер
Timer1.Enabled := FALSE;
FRecorderMode := recModeOff;
FMoreToPlay := FALSE;
// закройте устройство и освободите память заголовков
CloseWaveDevicePlay;
end;
//====================работа с сообщениями wave=================================
//вызывается если устройство завершило передачу данных в блок памяти, установленный
//процедурой waveInAddBuffer;
procedure TSysWaves.MMWimData(var msg: TMessage);
var
pwavehdrtmp : PWAVEHDR;
begin
// Сделанный буфер регистрации, выпишите это
pwavehdrtmp := PWAVEHDR(msg.lparam);
if WriteWaveBuffer(pwavehdrtmp.dwBytesRecorded) <> 0 then StopWaveRecord;
if FRecorderMode <> recModeOff then AddNextBuffer //буфер в очередь
else
CloseWaveDeviceRecord;// стоп запись
end;
//////////////////////////////////////////////////////////////////////////////
//Сделать проигрывание очередного волнового буфера, если проигран предыдущий.
procedure TSysWaves.MMWomDone(var msg: TMessage);
begin
if FMoreToPlay then QueueNextBuffer
else
StopWavePlay;
end;
/////////////////////////////////////////////////////////////////////////////
// посылается, когда устройство закрывается функцией waveOutClose;
procedure TSysWaves.MMWomClose(var msg: TMessage);
begin
FDeviceOpened := FALSE;
end;
////////////////////////////////////////////////////////////////////////////
// Запись записаных даных в временый файл
function TSysWaves.WriteWaveBuffer(size : UINT) : integer;
begin
Result := 0;
if size = 0 then Exit;
if _lwrite(FTmpFileHandle, FWaveMem[FBufIndex], size) <> size then begin
errormsg('Ошибка записи данных во временный файл.');
Result := -1;
Exit;
end;
Inc(FByteDataSize, size);
end;
{************************Other*******************************************************}
////////////////////////////////////////////////////////////////////////////
//вызывает окно выбора кодека
procedure TSysWaves.GetFormatClick(Sender: TObject);
begin
GetWaveFormat; //функция вызывающая визуальный выбор кодека
GetFormatTag.Caption := FFormatTag; //формат
GetFormatDesc.Caption := FFormatDesc; //его характеристики
SaveConf.Enabled:=true;
end;
////////////////////////////////////////////////////////////////////////////
//останавливает проигрывание записи и устанавливает запись на начало
procedure TSysWaves.StopClick(Sender: TObject);
begin
StopWavePlay;
end;
//////////////////////////////////////////////////////////////////////////////
//при изменениях настроек конфигурации разблокировать кнопку сохранения
procedure TSysWaves.RadioButton1Click(Sender: TObject);
begin
SaveConf.Enabled:=true;
end;
////////////////////////////////////////////////////////////////////////////
// выводит сообщение Msg на DisplayMemo
procedure TSysWaves.Display(Msg : String);
var
i:Integer;
begin
if DisplayMemo.Lines.Count > 100 then begin //если число линий >100 то
//удаляются 50 первых линий
for I := 1 to 50 do DisplayMemo.Lines.Delete(0);
end;
DisplayMemo.Lines.Add(Msg); //DisplayMemo выводит Msg
end;
////////////////////////////////////////////////////////////////////////////
//Выводит сообщение об ошибках.
procedure TSysWaves.errormsg(msg : String);
begin
Application.MessageBox(PChar(msg), 'Error', MB_OK);
end;
///////////////////////////////////////////////////////////////////////////
//сохранение настроек
procedure TSysWaves.SaveConfClick(Sender: TObject);
var
v:variant;
begin
try
ConfigFile:=TIniFile.Create(IncludeTrailingBackslash(ExtractFilePath(Application.ExeName))+'config.ini');
//сохранение параметров кодека
ConfigFile.WriteInteger('WaveFormat','FormatTag',FWaveFormat.wFormatTag);
ConfigFile.WriteInteger('WaveFormat','Channels',FWaveFormat.nChannels);
v:=FWaveFormat.nSamplesPerSec;
ConfigFile.WriteInteger('WaveFormat','SamplesPerSec',v);
v:=FWaveFormat.nAvgBytesPerSec;
ConfigFile.WriteInteger('WaveFormat','AvgBytesPerSec',v);
ConfigFile.WriteInteger('WaveFormat','BlockAlign',FWaveFormat.nBlockAlign );
ConfigFile.WriteInteger('WaveFormat','BitsPerSample',FWaveFormat.wBitsPerSample);
ConfigFile.WriteInteger('WaveFormat','Size',FWaveFormat.cbSize);
//сохранение параметров работы с модемом
if RadioButton1.Checked then ConfigFile.WriteBool('DeviceMode','AutoAnswer',true)
else ConfigFile.WriteBool('DeviceMode','AutoAnswer',false);
if CheckBox1.Checked then ConfigFile.WriteBool('DeviceMode','Pulse',true)
else ConfigFile.WriteBool('DeviceMode','Pulse',false);
ConfigFile.WriteInteger('DeviceMode','NumRings',StrToInt(MaskEdit1.Text));
ConfigFile.WriteInteger('DeviceMode','TimeReg',StrToInt(MaskEdit2.Text));
//настройки телефонной гарнитуры
ConfigFile.WriteInteger('VolGain','HeadSetVolume',HeadSetVolume.Position);
ConfigFile.WriteInteger('VolGain','HeadSetGain',HeadSetGain.Position);
ConfigFile.WriteInteger('VolGain','HandSetVolume',HandSetVolume.Position);
ConfigFile.WriteInteger('VolGain','HandSetGain',HandSetGain.Position);
ConfigFile.Free;
SaveConf.Enabled:=false;
except
errormsg('Ошибка сохранения настройки конфигурации!');
end;
end;
////////////////////////////////////////////////////////////////////////////
//проигрывание и пауза выбранного файла
procedure TSysWaves.PlayClick(Sender: TObject);
begin
if (Play.Caption = 'Пауза') and (FRecorderMode = recModePlay) then begin
Play.Caption:='Играть';
waveOutPause(FWaveOut);
Timer1.Enabled:=false;
exit;
end;
if (Play.Caption = 'Играть') and (FRecorderMode = recModePlay) then begin
waveOutRestart(FWaveOut);
Timer1.Enabled:=true;
Play.Caption:='Пауза';
exit;
end;
if (Play.Caption = 'Играть') and (FRecorderMode = recModeOff) then begin
//если чтение wav файла прошло успешно, то
if ReadWaveFile=0 then begin
Select.Enabled:=false;//блокирует кнопку отбора
NoSelect.Enabled:=false;//блокирует кнопку Отмены отбора
DelTrack.Enabled:=false;//блокирует кнопку удаления записи
Stop.Enabled:=true;//разблокирует кнопку останова
Play.Caption:='Пауза';// кнопку проигрывания
StartWavePlay //Подготовка заголовков, добавление буферов, и начинаем проигрывание.
end ;
end;
end;
{******************таймеры используемые в программе********************************}
/////////////////////////////////////////////////////////////////////////////
//Таймер для обновления позиции trackbar1 и времени проигрывания
procedure TSysWaves.Timer1Timer(Sender: TObject);
var
min,sec:integer;
begin
min:=0;//обнуление кол-ва минут
trackbar1.Position:=trackbar1.Position+1;//увеличение позиции trackbar1 на 1
//обработка времени проигрывания для приемлего представления его на форме
sec:=trackbar1.Position;
if sec/60 >= 1 then begin
Min:=trunc(Sec/60);
Sec:=trunc((Sec/60-Min)*60);
end;
Label11.Caption :=Format('%.2d:%.2d',[Min,Sec]);
end;
/////////////////////////////////////////////////////////////////////////////
//таймер для подсчета времени с начала состояния Connected
procedure TSysWaves.Timer3Timer(Sender: TObject);
begin
inc(FTimeCounter);//увеличиваем счетчик времени на 1 секунду
if FRecorderMode = recModeRecord then UpdateRecordDisplay
end;
{****************************************************************************}
//Включить отбор записей
procedure TSysWaves.SelectClick(Sender: TObject);
begin
Datamodule1.WavBase.SetRangeStart;
Datamodule1.WavBase.FieldByName('DateName').AsDateTime:=DateTimePicker1.Date;
Datamodule1.WavBase.SetRangeEnd;
Datamodule1.WavBase.FieldByName('DateName').AsDateTime:=DateTimePicker2.Date;
Datamodule1.WavBase.ApplyRange;
end;
//отменить отбор
procedure TSysWaves.NoSelectClick(Sender: TObject);
begin
Datamodule1.WavBase.CancelRange;
end;
//удаление из базы текущей записи
procedure TSysWaves.DelTrackClick(Sender: TObject);
begin
FFileName:= IncludeTrailingBackslash(ExtractFilePath(Application.ExeName)) +'WavBase\'+ datamodule1.WavBase.FieldByName('FileName').AsString;
if FileExists(FFileName) then DeleteFile(FFileName);
Datamodule1.WavBase.Delete;
end;
//При закрытии формы закрытие базы данных
procedure TSysWaves.FormClose(Sender: TObject; var Action: TCloseAction);
begin
Datamodule1.WavBase.Close;
end;
//при изменении обьема звука наушников
procedure TSysWaves.HeadSetVolUpDownChangingEx(Sender: TObject;
var AllowChange: Boolean; NewValue: Smallint;
Direction: TUpDownDirection);
begin
HeadSetVolume.Position:=2*NewValue;
SaveConf.Enabled:=true;
end;
//при изменении коэффициента усиления звука наушников
procedure TSysWaves.HeadSetGainUpDownChangingEx(Sender: TObject;
var AllowChange: Boolean; NewValue: Smallint;
Direction: TUpDownDirection);
begin
HeadSetGain.Position:=2*NewValue;
SaveConf.Enabled:=true;
end;
//при изменении обьема звука микрофона
procedure TSysWaves.HandSetVolUpDownChangingEx(Sender: TObject;
var AllowChange: Boolean; NewValue: Smallint;
Direction: TUpDownDirection);
begin
HandSetVolume.Position:=2*NewValue;
SaveConf.Enabled:=true;
end;
//при изменении коэффициента усиления звука микрофона
procedure TSysWaves.HandSetGainUpDownChangingEx(Sender: TObject;
var AllowChange: Boolean; NewValue: Smallint;
Direction: TUpDownDirection);
begin
HandSetGain.Position:=2*NewValue;
SaveConf.Enabled:=true;
end;
end.
Модуль данных
unit DataMode;
interface
uses
SysUtils, Classes, DB, DBTables,bde;
type
TDataModule1 = class(TDataModule)
WavBase: TTable;
DataSource1: TDataSource;
WavBaseID: TAutoIncField;
WavBaseDateName: TDateField;
WavBaseTimeName: TTimeField;
WavBaseUserName: TStringField;
WavBaseFileName: TStringField;
procedure WavBaseAfterCancel(DataSet: TDataSet);
private
{ Private declarations }
public
{ Public declarations }
end;
var
DataModule1: TDataModule1;
implementation
{$R *.dfm}
//сброс кэша на диск с помощью механизма BDE
procedure TDataModule1.WavBaseAfterCancel(DataSet: TDataSet);
begin
Check(dbiSaveChanges(WavBase.Handle));
end;
end.
Модуль со справочной информацией
unit About;
interface
uses
Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
Dialogs, StdCtrls, ExtCtrls;
type
TAbouts = class(TForm)
Panel1: TPanel;
ProductName: TLabel;
Version: TLabel;
Copyright: TLabel;
Label2: TLabel;
OKButton: TButton;
ProgramIcon: TImage;
procedure OKButtonClick(Sender: TObject);
private
{ Private declarations }
public
{ Public declarations }
end;
var
Abouts: TAbouts;
implementation
{$R *.dfm}
//При нажатии кнопки 'Ок'
procedure TAbouts.OKButtonClick(Sender: TObject);
begin
close;
end;
end.
Модуль выбора интерфейса
unit VarTo;
interface
uses
Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
Dialogs, StdCtrls, Buttons;
type
TVarS = class(TForm)
GroupBox1: TGroupBox;
RadioButton1: TRadioButton;
RadioButton2: TRadioButton;
BitBtn1: TBitBtn;
BitBtn2: TBitBtn;
UserName: TEdit;
procedure BitBtn2Click(Sender: TObject);
procedure BitBtn1Click(Sender: TObject);
procedure RadioButton2Click(Sender: TObject);
procedure RadioButton1Click(Sender: TObject);
private
{ Private declarations }
public
{ Public declarations }
end;
var
VarS: TVarS;
implementation
{$R *.dfm}
//При нажатии кнопки 'Выход'
procedure TVarS.BitBtn2Click(Sender: TObject);
begin
Application.Terminate;
end;
//При нажатии кнопки 'Вход'
procedure TVarS.BitBtn1Click(Sender: TObject);
begin
if RadioButton1.Checked then VarS.Tag:=1;
if RadioButton2.Checked then VarS.Tag:=2;
close;
end;
//При выборе интерфейса - администратор
procedure TVarS.RadioButton2Click(Sender: TObject);
begin
UserName.Enabled:=false;
end;
//При выборе интерфейса - пользователь
procedure TVarS.RadioButton1Click(Sender: TObject);
begin
UserName.Enabled:=true;
end;
end.