2.6. Особенности акустических средств передачи (кодирования) невербальной информации
К оглавлению1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1617 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
34 35 36 37 38 39 40 41 42 43
Основными акустическими средствами передачи различных видов невербальной информации от говорящего к слушателю являются: а) тембр голоса, физическим эквивалентом которого является спектр звука, т. е. графическое отображение частотного (обертонового) состава голоса, б) мелодика речи (изменение высоты голоса во времени), в) энергетические характеристики (сила голоса и ее изменение), г) темпо-ритмические особенности речи, д) атипичные индивидуальные особенности произношения (смех, покашливание, заикание и т. п.).
Носителем вербальной фонетической информации является спектр сложного речевого звука, точнее — динамика форматной структуры спектра во времени (Фант, 1964). При этом для речи высота голоса, т. е. частота основного тона практически не имеет значения , поскольку любую речевую информацию можно передать голосом любой частоты в пределах звуковысотного диапазона говорящего. Что же касается невербальных видов информации, то носителем ее наряду со спектром служат и звуковысотные характеристики голоса (мелодика речи, т.е. динамика частоты основного тона). Именно поэтому ограничение спектра высоких частот до 300-200 Гц (т. е. изъятие их из спектра с помощью электроакустических фильтров) приводит к полному разрушению вербальной информации (потере разборчивости речи) при значительной сохранности эмоциональной, индивидуальной и других видов невербальной информации (Морозов, 1989). Указанная особенность невербальной, в частности, эмоциональной информации позволяет моделировать ее средствами инструментальной музыки, голосом певца, поющего одну лишь мелодию на одной гласной (вокализ), и даже частотно-модулированным чистым тоном (свистом). Музыкальные категории —минор и мажор—являются следствием этой закономерности.
2 Следует заметить, что мелодика речи, будучи важнейшим компонентом интонации (последняя реализуется также с участием ударения и темпоритмических характеристик речи), играет немаловажную роль в передаче и смысловых характеристик высказывания (вопрос, утверждение, завершеннность, незавершенность (Зиндер, 1979; Светозарова, 1982)
Высота голоса и ее изменения во времени выступает носителем не только эмоциональной, но и других видов невербальной информации, например, возрастной, половой, индивидуально-личностной. Биофизической основой этого является, в частности, обратно пропорциональная зависимость частоты основного тона речи человека от длины и массивности его голосовых связок (Медведев и др., 1959). У женщин и детей, связки которых короче и тоньше, чем у мужчин, высота голоса, соответственно, выше примерно на октаву. Этой же закономерностью определяются индивидуальные различия в высоте голоса разных людей: высокие и массивные люди имеют, как правило, более крупную гортань и, соответственно, более низкие голоса по сравнению с низкорослыми и худыми людьми. Указанные закономерности находят отражение в высоких коэффициентах корреляции между высотой голоса людей, с одной стороны, и их полом, возрастом и весом, с другой стороны.
3 Указанное соотношенние приблизительно описывается формулой: Fo=KVCP/LM, где F0 — частота колебаний голосовых складок (Гц), т.е. — частота основного тона, Р — величина под-связочного давления в трахее, С — степень жесткости (или натяжения) голосовых связок, L — длина колеблющейся части, М — колеблющаяся масса, к — коэффициент пропорциональности (Морозов, 1977).
Р%—вероятность правильных оценок
Узнавание голосов (no Рамишвили, 1981)
Определение эмоций (по Морозову и др,1985)
Разборчивость речи (Покровский, 1970)
Рис. 4. Невербальная экстралингвистическая информация голоса оказывается более помехоустойчивой (по сравнению с лингвистической) не только по отношению к действию шума, но и по отношению к частотному ограничению спектра. График показывает, что ограничение высоких частот до 400 Гц почти полностью разрушает лингвистическую информацию (разборчивость слов падает до 5,5%) определение же эмоций в таком сигнале, также как и узнавание диктора, в значительной степени сохраняются, 60% и 70% соответственно (по Морозов и др., Язык эмоций, мозг и компьютер, 1989).
Наряду с этим установлено, что важнейшим средством психоакустического кодирования невербальной информации является спектр звука, определяющий, как известно, тембр голоса. Интегральный спектр голоса и речи с различным эмоциональным содержанием существенно различаются, особенно в высокочастотных областях спектра (см. рис. 5). Так, для гнева характерно усиление высоких обертонов, что приводит к увеличению звонкости, «металличности» тембра, а для страха— наоборот— сильное падение высоких обертонов, что делает голос глухим, «тусклым», «сдавленным». Радость приводит к смещению формантных частот в более высокочастотную область, в результате того, что человек говорит как бы «на улыбке» (см. рис. 5 — спектр голоса Ф. Шаляпина при выражении разных эмоций).
При распознавании знакомых и незнакомых людей по звуку их голоса (индивидуально-личностная невербальная информация) испытуемые указывают, что они ориентируются на свойственное разным людям различие в тембрах (т. е. в спектрах) голосов наряду с интонационными и другими особенностями их речи (Пашина, Морозов, 1990). Сила голоса и в особенности динамика ее изменений во времени — также важное акустическое средство кодирования невербальной информации. Так, для печали характерна слабая, а для гнева — увеличенная сила голоса и т. п. Изменение силы голоса во времени - весьма информативный показатель: медленные ее нарастания и спады (также как и высоты тона) характерны для печали («плачущие интонации»), а резкие взлеты и обрывы - для гнева (см. рис. 6).
Подчеркнем, что именно динамика акустических
Частота обертонов голоса, Гц
Рис. 5. Интегральные спектры голоса Ф. Шаляпина при исполнении им отрывков из вокальных произведений, насыщенных различным эмоциональным содержанием, показывают сильные различия в уровне и частотном положении высоких обертонов голоса при выражении радости, горя, гнева, страха. Эти различия и обуславливают характерные изменения тембра голоса артиста при выражении эмоций.
Эмоционально окрашенные фразы взяты из следующих произведений: гнев — из сцены И. Сусанин в лесу («Табор вражеский заснул Стопе крепко до зари») из оперы «Жизнь за царя». Радость — речитатив Галицкого: «Грешно таить, я скуки не люблю ...» из оперы «Князь Игорь». Печаль — «Ах ты ноченька ...» — русская народная песня «Ноченька». Страх— «Вон, вон там! Что это там?! В углу!!! Колышется!..» — сцена из оперы «Борис Годунов», (по В Л Морозов, 1989).
Рис. 6. Осциллограммы голоса, т.е. графическое изображение динамики звука во времени, показывают, что каждая эмоциональная интонация -радость, горе, безразличие, гнев, страх -выражается своими особыми, характерными для нее акустическими средствами (по Морозов, 1989).
Наконец, существенная роль в кодировании невербальной информации принадлежит темпо-ритмическим характеристикам речи. Так, одна и та же фраза («Прости, я сам все расскажу...»), произнесенная по просьбе исследователей известным артистом О. Басилашвили с разными эмоциональными опенками, имела средний темп произнесения (слогов в секунду) при выражении: радости — 5,00, печали — 1,74, гнева — 2,96, страха — 4,45. Аналогичные результаты получены при анализе эмоциональной выразительности вокальной речи параметров - важнейшее средство кодирования всех видов речевой информации/
При исследовании людей разных возрастных групп (биофизическая информация) оказалось, что их средние статистические характеристики темпа речи существенно различаются: в группе молодых людей (17-25 лет) — 3,52 слога в секунду, в группе среднего возраста (38-45 лет) — 3,44, в группе старшего возраста (50-64 года) — 2,85, в группе старческого возраста (75-82 года) — 2,25 слога в секунду. Это вызвано тем, что с возрастом замедляется активность артикуляционного процесса. Коэффициент корреляции между показателями возраста и темпа речи (по группе обследуемых 33 человека) оказался равным R=0,6134 (при вероятности нуль-гипотезы р=0,0001).
Иллюстрацией важности ритмической организации речи в передаче эстетической информации может служить ритм стиха. Стихотворный ритм, как известно, отличается от ритма прозы своей упорядоченностью, т.е. равномерным чередованием ударных или безударных слогов (ямб, хорей, дактиль, амфибрахий и др.), а также одинаковым числом слогов в строке. Таким образом, помимо поэтического изящества мысли (метафоричность, лиричность и др.), что достигается вербальными средствами, стихотворный жанр характеризуется и невербальными особенностями — упорядоченной ритмической организацией, и, естественно, рифмой, что достигается фонетическими средствами, т.е. известным подбором благозвучных (сходных по звучанию) фонемных окончаний последних слов в стихотворных строках.
Важнейшая особенность кодирования невербальной информации речи состоит во взаимодействии различных акустических средств, иными словами, любой вид невербальной информации передается, как правило, не каким-либо одним акустическим средством, а одновременно несколькими. Например, информация о разном эмоциональном состоянии говорящего найдет выражение не только в изменении тембра (т.е. спектра) голоса, но и в характерных для каждой эмоции изменениях высоты, силы, темпо-ритмических характеристик речевой фразы (см. рис. 6).
Так, эмоция гнева наряду с общим увеличением силы голоса приводит также к увеличению высоты голоса, укорочению фронтов нарастания и спада звука, т.е. к увеличению резкости речевых звуков. Эмоция печали, наоборот, характеризуется медленным нарастанием и спадом силы и высоты голоса, увеличенной длительностью слогов, падением силы и звонкости голоса.
Указанные характерные комплексные изменения акустических свойств голоса и речи вызваны соответствующими изменениями общего физиологического состояния человека при разных эмоциях, например, усилением общей нервно-мышечной активности в состоянии гнева или общей нервно-психологической подавленностью и мышечной расслабленностью организма при печали. Это закономерно и отражается на работе органов образования голоса и речи.
Таким образом, различные био-физические характеристики человека (пол, возраст, рост, вес), эмоциональное состояние и другие психологические свойства говорящего закономерно отражаются в акустических особенностях его речи и голоса, а это, в свою очередь, является объективной основой для адекватного субъективного восприятия говорящего слушателем
Основными акустическими средствами передачи различных видов невербальной информации от говорящего к слушателю являются: а) тембр голоса, физическим эквивалентом которого является спектр звука, т. е. графическое отображение частотного (обертонового) состава голоса, б) мелодика речи (изменение высоты голоса во времени), в) энергетические характеристики (сила голоса и ее изменение), г) темпо-ритмические особенности речи, д) атипичные индивидуальные особенности произношения (смех, покашливание, заикание и т. п.).
Носителем вербальной фонетической информации является спектр сложного речевого звука, точнее — динамика форматной структуры спектра во времени (Фант, 1964). При этом для речи высота голоса, т. е. частота основного тона практически не имеет значения , поскольку любую речевую информацию можно передать голосом любой частоты в пределах звуковысотного диапазона говорящего. Что же касается невербальных видов информации, то носителем ее наряду со спектром служат и звуковысотные характеристики голоса (мелодика речи, т.е. динамика частоты основного тона). Именно поэтому ограничение спектра высоких частот до 300-200 Гц (т. е. изъятие их из спектра с помощью электроакустических фильтров) приводит к полному разрушению вербальной информации (потере разборчивости речи) при значительной сохранности эмоциональной, индивидуальной и других видов невербальной информации (Морозов, 1989). Указанная особенность невербальной, в частности, эмоциональной информации позволяет моделировать ее средствами инструментальной музыки, голосом певца, поющего одну лишь мелодию на одной гласной (вокализ), и даже частотно-модулированным чистым тоном (свистом). Музыкальные категории —минор и мажор—являются следствием этой закономерности.
2 Следует заметить, что мелодика речи, будучи важнейшим компонентом интонации (последняя реализуется также с участием ударения и темпоритмических характеристик речи), играет немаловажную роль в передаче и смысловых характеристик высказывания (вопрос, утверждение, завершеннность, незавершенность (Зиндер, 1979; Светозарова, 1982)
Высота голоса и ее изменения во времени выступает носителем не только эмоциональной, но и других видов невербальной информации, например, возрастной, половой, индивидуально-личностной. Биофизической основой этого является, в частности, обратно пропорциональная зависимость частоты основного тона речи человека от длины и массивности его голосовых связок (Медведев и др., 1959). У женщин и детей, связки которых короче и тоньше, чем у мужчин, высота голоса, соответственно, выше примерно на октаву. Этой же закономерностью определяются индивидуальные различия в высоте голоса разных людей: высокие и массивные люди имеют, как правило, более крупную гортань и, соответственно, более низкие голоса по сравнению с низкорослыми и худыми людьми. Указанные закономерности находят отражение в высоких коэффициентах корреляции между высотой голоса людей, с одной стороны, и их полом, возрастом и весом, с другой стороны.
3 Указанное соотношенние приблизительно описывается формулой: Fo=KVCP/LM, где F0 — частота колебаний голосовых складок (Гц), т.е. — частота основного тона, Р — величина под-связочного давления в трахее, С — степень жесткости (или натяжения) голосовых связок, L — длина колеблющейся части, М — колеблющаяся масса, к — коэффициент пропорциональности (Морозов, 1977).
Р%—вероятность правильных оценок
Узнавание голосов (no Рамишвили, 1981)
Определение эмоций (по Морозову и др,1985)
Разборчивость речи (Покровский, 1970)
Рис. 4. Невербальная экстралингвистическая информация голоса оказывается более помехоустойчивой (по сравнению с лингвистической) не только по отношению к действию шума, но и по отношению к частотному ограничению спектра. График показывает, что ограничение высоких частот до 400 Гц почти полностью разрушает лингвистическую информацию (разборчивость слов падает до 5,5%) определение же эмоций в таком сигнале, также как и узнавание диктора, в значительной степени сохраняются, 60% и 70% соответственно (по Морозов и др., Язык эмоций, мозг и компьютер, 1989).
Наряду с этим установлено, что важнейшим средством психоакустического кодирования невербальной информации является спектр звука, определяющий, как известно, тембр голоса. Интегральный спектр голоса и речи с различным эмоциональным содержанием существенно различаются, особенно в высокочастотных областях спектра (см. рис. 5). Так, для гнева характерно усиление высоких обертонов, что приводит к увеличению звонкости, «металличности» тембра, а для страха— наоборот— сильное падение высоких обертонов, что делает голос глухим, «тусклым», «сдавленным». Радость приводит к смещению формантных частот в более высокочастотную область, в результате того, что человек говорит как бы «на улыбке» (см. рис. 5 — спектр голоса Ф. Шаляпина при выражении разных эмоций).
При распознавании знакомых и незнакомых людей по звуку их голоса (индивидуально-личностная невербальная информация) испытуемые указывают, что они ориентируются на свойственное разным людям различие в тембрах (т. е. в спектрах) голосов наряду с интонационными и другими особенностями их речи (Пашина, Морозов, 1990). Сила голоса и в особенности динамика ее изменений во времени — также важное акустическое средство кодирования невербальной информации. Так, для печали характерна слабая, а для гнева — увеличенная сила голоса и т. п. Изменение силы голоса во времени - весьма информативный показатель: медленные ее нарастания и спады (также как и высоты тона) характерны для печали («плачущие интонации»), а резкие взлеты и обрывы - для гнева (см. рис. 6).
Подчеркнем, что именно динамика акустических
Частота обертонов голоса, Гц
Рис. 5. Интегральные спектры голоса Ф. Шаляпина при исполнении им отрывков из вокальных произведений, насыщенных различным эмоциональным содержанием, показывают сильные различия в уровне и частотном положении высоких обертонов голоса при выражении радости, горя, гнева, страха. Эти различия и обуславливают характерные изменения тембра голоса артиста при выражении эмоций.
Эмоционально окрашенные фразы взяты из следующих произведений: гнев — из сцены И. Сусанин в лесу («Табор вражеский заснул Стопе крепко до зари») из оперы «Жизнь за царя». Радость — речитатив Галицкого: «Грешно таить, я скуки не люблю ...» из оперы «Князь Игорь». Печаль — «Ах ты ноченька ...» — русская народная песня «Ноченька». Страх— «Вон, вон там! Что это там?! В углу!!! Колышется!..» — сцена из оперы «Борис Годунов», (по В Л Морозов, 1989).
Рис. 6. Осциллограммы голоса, т.е. графическое изображение динамики звука во времени, показывают, что каждая эмоциональная интонация -радость, горе, безразличие, гнев, страх -выражается своими особыми, характерными для нее акустическими средствами (по Морозов, 1989).
Наконец, существенная роль в кодировании невербальной информации принадлежит темпо-ритмическим характеристикам речи. Так, одна и та же фраза («Прости, я сам все расскажу...»), произнесенная по просьбе исследователей известным артистом О. Басилашвили с разными эмоциональными опенками, имела средний темп произнесения (слогов в секунду) при выражении: радости — 5,00, печали — 1,74, гнева — 2,96, страха — 4,45. Аналогичные результаты получены при анализе эмоциональной выразительности вокальной речи параметров - важнейшее средство кодирования всех видов речевой информации/
При исследовании людей разных возрастных групп (биофизическая информация) оказалось, что их средние статистические характеристики темпа речи существенно различаются: в группе молодых людей (17-25 лет) — 3,52 слога в секунду, в группе среднего возраста (38-45 лет) — 3,44, в группе старшего возраста (50-64 года) — 2,85, в группе старческого возраста (75-82 года) — 2,25 слога в секунду. Это вызвано тем, что с возрастом замедляется активность артикуляционного процесса. Коэффициент корреляции между показателями возраста и темпа речи (по группе обследуемых 33 человека) оказался равным R=0,6134 (при вероятности нуль-гипотезы р=0,0001).
Иллюстрацией важности ритмической организации речи в передаче эстетической информации может служить ритм стиха. Стихотворный ритм, как известно, отличается от ритма прозы своей упорядоченностью, т.е. равномерным чередованием ударных или безударных слогов (ямб, хорей, дактиль, амфибрахий и др.), а также одинаковым числом слогов в строке. Таким образом, помимо поэтического изящества мысли (метафоричность, лиричность и др.), что достигается вербальными средствами, стихотворный жанр характеризуется и невербальными особенностями — упорядоченной ритмической организацией, и, естественно, рифмой, что достигается фонетическими средствами, т.е. известным подбором благозвучных (сходных по звучанию) фонемных окончаний последних слов в стихотворных строках.
Важнейшая особенность кодирования невербальной информации речи состоит во взаимодействии различных акустических средств, иными словами, любой вид невербальной информации передается, как правило, не каким-либо одним акустическим средством, а одновременно несколькими. Например, информация о разном эмоциональном состоянии говорящего найдет выражение не только в изменении тембра (т.е. спектра) голоса, но и в характерных для каждой эмоции изменениях высоты, силы, темпо-ритмических характеристик речевой фразы (см. рис. 6).
Так, эмоция гнева наряду с общим увеличением силы голоса приводит также к увеличению высоты голоса, укорочению фронтов нарастания и спада звука, т.е. к увеличению резкости речевых звуков. Эмоция печали, наоборот, характеризуется медленным нарастанием и спадом силы и высоты голоса, увеличенной длительностью слогов, падением силы и звонкости голоса.
Указанные характерные комплексные изменения акустических свойств голоса и речи вызваны соответствующими изменениями общего физиологического состояния человека при разных эмоциях, например, усилением общей нервно-мышечной активности в состоянии гнева или общей нервно-психологической подавленностью и мышечной расслабленностью организма при печали. Это закономерно и отражается на работе органов образования голоса и речи.
Таким образом, различные био-физические характеристики человека (пол, возраст, рост, вес), эмоциональное состояние и другие психологические свойства говорящего закономерно отражаются в акустических особенностях его речи и голоса, а это, в свою очередь, является объективной основой для адекватного субъективного восприятия говорящего слушателем