Terra Humana

124 УДК 808.2+534 ББК 4р(075)

В.О. Романенко

эмоциональные характеристики вокальной речи и их связь с акустическими параметрами

Вокальная речь (пение) предназначена, прежде всего, для передачи эмоционально-эстетической информации. Проблема взаимосвязи эмоций с акустическими параметрами вокальной речи лежит в основе методик обучения пению, моделирования пения, развития электронных искусств, работы звукорежиссера с вокальной речью. В статье представлен обзор исследований этой проблемы, проводимых в течение длительного времени. Описаны взаимосвязи эмоций с изменениями таких параметров, как частота основного тона, высокая певческая форманта, вибрато и тремоло, темпо-ритмические характеристики и др.

Ключевые слова:

акустические параметры, вокальная речь, эмоциональные характеристики.

Объектом анализа является взаимосвязь эмоциональных характеристик (в т.ч. акустических параметров) вокальной речи (пения). Эта взаимосвязь во многом базируется на результатах, полученных в процессе исследования речи [7], но имеет ряд отличительных особенностей.

Вокальная речь (пение) - особая разновидность речи, предназначенная, прежде всего, для передачи эмоционально-эстетической информации. Она аккумулирует в себе как специфические особенности музыкального сигнала (мелодия вокальной речи, чередование длительности гласных, подчиненное ритму и др.), так и общие с речевым (механизм звукообразования, фонетический строй и т.д.), хотя имеет ряд отличий видоизменённых и деформированных в соответствии с требованиями искусства [4].

К основным особенностям вокальной речи относятся: особая специфика организации дыхания; большая сила голоса; увеличение диапазона воспроизводимых частот; особый спектральный состав с высокой певческой формантой; наличие частотной и амплитудной модуляций (вибрато и тремоло); значительное преобладание по мощности, громкости и длительности гласных над согласными и др.

Результаты исследований вокальной речи [4; 11] имеют огромную научную ценность, они используются в вокально-педагогической практике, в области синтеза и распознавания эмоций в пении, в электронных искусствах, в том числе в работе звукорежиссера и композитора (для усиления эмоционального воздействия на слушателя) и т.п.

К проблемам распознавания эмоций в вокальной речи обращаются физиологи, психологи, акустики, лингвисты с целью

получения новых данных экспериментов, расширения круга исследуемых эмоций, создания баз данных по эмоциям в пении и т.д.

Исследования, посвященные взаимосвязи эмоциональных характеристик с акустическими параметрами вокальной речи начались в начале XX в. В 1928 г. американский ученый M. Sherman поставил эксперимент по распознаванию четырех эмоций: злости-ненависти, удивления, печали и страха-огорчения [15]. Певец имитировал эти эмоции на разных звуках, продолжительностью 1,5 секунды пять раз. Результаты показали, что восемь из двадцати записанных эмоциональных фрагментов были правильно распознаны слушателями. Следующие исследования эмоций в пении были сделаны в 1932 г. М. Metfessel [12]. Основной акцент работы принадлежал изучению вибрато - одной из акустических характеристик, присущей именно вокальной речи, построенной на частотной модуляции звука. Вибрато обогащает спектр голоса, делает тембр более живым, является одним из средств выражения эмоций [1, с. 441-449]. Для ряда оперных певцов, записи голосов которых анализировал М. Metfessel, средняя глубина модуляции оказалась равной 30 центам, а средняя частота модуляции 6-7 Гц.

Работы В.П. Морозова в 1970-е гг. ознаменовали новый этап изучения вокальной речи после длительного перерыва (с 1940-х гг.) [3-6]. За основу экспериментов были взяты вокальные фразы, исполненные певцами как с различными эмоциональными акцентами («радость», «горе», «страх», «гнев») так и без проявления эмоций, которые оценивали эксперты разных возрастов и разного музыкального образования. В ходе оценок экспертами выясни-

лось, что вероятность правильных ответов напрямую зависит от уровня музыкальной культуры слушателя. В.П. Морозовым был введен новый термин - эмоциональный слух (способность к определению эмоционального состояния говорящего по звуку его голоса) [3]. Степень распознавания пяти эмоций, выбранных для эксперимента, оказалась разной: страх - 86%, гнев - 79%, горе - 68%, безразличие - 64%, радость -42%. Результаты показали, что радость распознается всеми без исключения слушателями хуже, чем другие эмоции. Соответственно при передаче гнева, страха, горя существует больше акустических возможностей для распознавания.

Отрицательные эмоции в жизни имеют более важное биологическое значение, хотя человек вследствие инстинкта стремится продлить положительное состояние. «Отрицательная эмоция - это сигнал тревоги, крик организма о том, что данная ситуация для него гибельна. Положительная эмоция - сигнал возвращенного благополучия» [2, с. 79.].

Измерения объективных характеристик при исполнении различных эмоций позволили В.П. Морозову выявить основные закономерности, связанные с изменением следующих характеристик:

- Мелодический рисунок фразы (динамика изменения частоты основного тона). При выражении «радости» в мелодическом рисунке происходит интонационный подъем звука, при выражении «страха» мелодический рисунок теряет свою устойчивость, при «гневе» для мелодического рисунка характерны звуковысотные скачки, при «горе» в мелодическом рисунке появляются «подъезды» (взятие ноты «снизу») и «съезды» (взятие ноты «сверху») [4, с.167], при «безразличии» мелодический рисунок уплощается.

- Характеристика вибрато и тремоло (частотной и амплитудной модуляции). При выражении «гнева» амплитуда модуляции вибрато существенно увеличивается, частота составляет 6-6,5 Гц, при «страхе» кривая вибрато теряет периодичность и частота достигает 8 Гц. При «горе» и «безразличии» уменьшается амплитуда и частота вибрато составляет 5-6 Гц.

- Интегральные характеристики спектра. При «радости» частотное положение высокой певческой форманты сдвигается в более высокую частотную область, что придает звучанию легкость, прозрачность и яркость. При «гневе» вершина высокой певческой форманты сдвигается вниз, она становится менее выраженной и интен-

сивность высоких частот падает, что придает звучанию мрачность. При «страхе» и «горе» выраженность высокой певческой форманты уменьшается, интенсивность высоких частот падает, спектрограмма приближается по свойствам к речевому сигналу - голос становится глухой, сдавленный.

- Временные и динамические характеристики сигнала:

а) Средняя длительность слога во фразе. Наибольшая длительность слога во фразе - при выражении «горя» (1240 мс), наименьшая - при выражении «страха» (540 мс); у остальных эмоций - средние значения, которые соответствуют: при «радости» - 920 мс, при «безразличии» - 1130 мс и при «гневе» - 820 мс.

б) Относительная длительность пауз во фразе по отношению к общей длительности фразы. Наибольшая величина пауз - при выражении «страха» (12,6%), наименьшая - при «безразличии» (2,1%). При «радости», «горе» и «гневе» наблюдаются значения 3,6%, 5,3% и 4,9% соответственно.

в) Время атаки и спада. Максимальное время атаки (626 мс) и спада (641 мс) наблюдается при выражении «горя», минимальное - при выражении «гнева» (атака -218 мс, спад - 210 мс).

г) Сила голоса (Уровень звукового давления). Наибольшая сила голоса - при выражении «гнева» (100 дБ), наименьшее -при «страхе» (92 дБ) и «безразличии» (93 дБ). При «радости» и «горе» - 96 дБ и 95 дБ соответственно.

К началу XXI в. количество исследований эмоционального содержания вокальной речи (пения) и ее взаимосвязи с акустическими характеристиками значительно возросло. Дальнейшие исследования в области анализа эмоций в пении проводили J. Sundberg [18], K.R.Scherer [14], M. Baroni [8; 9], S. Jansens [10] и др. Ученые рассматривали эмоции в голосе, используя несколько различных методов: выделяли акустические характеристики в записи естественного исполнения с разным выражением эмоций, исходя из содержания фрагментов; в звукозаписях, принадлежащих музыкальному наследию великих певцов; в записях с намеренным исполнением определенных эмоций (одна или несколько различных эмоций в заданном музыкальном отрывке).

Изменения мелодического рисунка фразы, временных и динамических характеристик, а также других акустических параметров вокальной речи исследовал

Общество

Terra Humana

J. Sundberg [17]. За основу эксперимента были взяты фразы из вокальных циклов немецких композиторов, для каждой из фраз были выбраны две эмоции (уверенность и счастье, ненависть и гнев, любовь и грусть и др.). Певец исполнял вокальные фразы как. с выражением определенной эмоции, так и неэмоционально. Один из примеров вокальных фраз (рис. 1) - «Mein Vater, mein Vater, und h^est du nicht» («Отец мой, отец мой, и ты не слышишь») из песни Франца Шуберта «Лесной царь». Акустический анализ показал интонационный подъем звука при выражении гнева, вибрато приобрело больший размах, темп несколько замедлился.

S. Jansens, G. Bloothooft и G.de Krom [10] продолжили исследование J. Sundberg и рассмотрели данную фразу на выражение «гнева», «радости», «страха» и «грусти» по двадцати акустическим параметрам. В эксперименте участвовали 25 слушателей-непрофессионалов, которые оценивали семьдесят фрагментов, исполненные с разными эмоциями четырнадцатью певцами. В каждой фразе были проанализированы: структура гласных во фразах, изменение частоты основного тона, вибрато, динамические и временные характеристики. К полученным акустическим параметрам относятся: размах вибрато при гневе достигает 9,2 Гц, при радости - 4,4 Гц, при «грусти» вибрато отсутствует.

Исследования, проводимые на рубеже XX-XXI вв., значительно расширили набор акустических характеристик эмоций вокальной речи. Одной из значительных

работ по анализу звукозаписей выдающихся певцов стала статья H. Siegwart и K.R. Scherer [16]. Авторы исследовали отрывок из сцены сумасшествия из оперы Доницетти «Лючия ди Ламмермур» в исполнении пяти выдающихся певиц (Марии Каллас, Ренаты Скотто, Джоан Сазерленд, Эдиты Груберовой и Тоти Даль Монте). Фонограммы оценивали по выражениям четырех эмоций: «нежная страсть», «страх смерти», «сумасшествие» и «грусть», а также выявляли предпочтение исполнения одной из певиц.

Анализ записей позволил выделить следующие акустические параметры: Уровень звукового давления (total energy): Даль Монте - 77,64 дБ, Рената Скотто - 67,7 дБ, Эдита Груберова - 65,52 дБ, Мария Каллас - 69,15 дБ, Джоан Сазерленд - 71,28 дБ. Диапазон изменения уровня звукового давления (energy variability): Даль Монте - 16,84дБ, Рената

Скотто - 13,84 дБ, Эдита Груберова - 12,17 дБ, Мария Каллас - 13,45 дБ, Джоан Сазерленд - 10,12 дБ. Положение высокой певческой форманты: Даль Монте - 2351 Гц, Рената Скотто - 2273Гц, Эдита Грубе-рова - 2522 Гц, Мария Каллас - 2408 Гц, Джоан Сазерленд - 2161.

J. Sundberg отмечает, что высокая певческая форманта у сопрано более слабо-выраженная, в отличие от других типов голоса. У Эдиты Груберовой - колоратурного сопрано уровень звукового давления высокой певческой форманты ниже и соответствует 78 дБ, тогда как у Даль Монте - 98дБ, Ренаты Скотто - 89 дБ, Марии Каллас - 96 дБ, Джоан Сазерленд - 88 дБ.

К анализу записей выдающихся исполнителей XX в. (Монсеррат Кабалье, Лучано Паваротти, Эдиты Грубе-ровой и др.) обращалась E. Rapoport [13]. В её работе была проанализирована высокая певческая форманта в девяти разных эмоциональных ситуациях (нейтраль, спокойствие, экспрессия, восторг и др.) и выполнена классификация эмоций в голосе по степени ее выраженности.

Общий анализ взаимосвязи акустических параметров c эмоциональными характеристиками пения сделан P. Juslin и P.Laukka [11]. Было показано, что

Рис. 1. Осциллограмма изменения частоты основного тона

«гнев» характеризуется быстрым темпом, высоким уровнем высокочастотной энергии, острым контуром огибающей фундаментальной частоты, большим диапазоном изменения фундаментальной частоты, быстрой атакой. «Страху» соответствует быстрый темп, высокий уровень высокочастотной энергии, узкий диапазон изменения фундаментальной частоты, медленная атака. «Радость» имеет быстрый темп, средний уровень высокочастотной энергии, широкий диапазон изменения фундаментальной частоты и быструю атаку. «Грусти» соответствует медленный темп, низкий уровень высокочастотной энергии, узкий диапазон изменения фундаментальной частоты, медленная атака. «Нежность» характеризуется медленным темпом, низким уровнем высокочастотной энергии, узким диапазоном изменения фундаментальной частоты и медленной атакой.

Результаты, полученные в процессе изучения вокальной речи, показывают, что основными акустическими средствами передачи эмоциональной информации являются: тембр голоса, т.е. динамический спектр звука; энергетические характеристики звукового сигнала (сила голоса) и их изменение во времени; изменение высоты основного тона во времени, т.е. мелодика вокальной речи; темпо-ритмические особенности вокальной речи; индивидуальные особенности произношения (дикция и разборчивость) и др.

Поиск количественной связи эмоциональных характеристик вокальной речи с акустическими параметрами, которыми они кодируются - один из основных аспектов дальнейшего развития электронных искусств и, в частности, - главный инструмент, позволяющий звукорежиссеру управлять эмоциональностью пения и создавать новые электронные тембры.

Список литературы:

[1] Алдошина И.А. Музыкальная акустика. - СПб.: Композитор, 2006.

[2] Додонов Б. Эмоция как ценность. - М., 1978.

[3] Морозов В.П. Искусство резонансного пения. Основы резонансной теории и техники. - М.: ИП-

РАНб МГК им. Чайковского, 2002.

[4] Морозов В.П. Биофизические основы вокальной речи. - Л.: Наука, 1977.

[5] Морозов В.П. Тайны вокальной речи. - Л.: Наука, 1967.

[6] Морозов В. П.: Искусство и наука общения: невербальная коммуникация. - М.: ИП РАН, Центр «Искусство и наука», 1998.

[7] Романенко В.О. Эмоциональные характеристики речи и их связь с акустическими параметрами // Общество. Среда. Развитие. - 2010, № 4. -119-123.

[8] Baroni M., Caterina R., Regazzi F., Zanarini G. Emotional aspects of singing voice // Proceedings of the Third Triennial ESCOM Conference / Ed. A. Gabrielsson. - Uppsala: Uppsala University, 1997. - 484-489.

[9] Baroni M., Finarelli L. Emotions in spoken language and in vocal music // Proceedings of the Third International Conference for Music Perception and Cognition Lierge. - Belgium: University of Lierge, 1994. - 343345.

[10] Jansens S., Bloothooft G., de Krom G. Perception and acoustics of emotions in singing // Proceedings of the Fifth European Conference on Speech Communication and Technology. Vol. IV. - Rhodes, Greece: European Speech Communication Association, 1997. - 2155-2158.

[11] Juslin P.N., Laukka P. Communication of Emotions in Vocal Expression and Music Performance: Different Channels, Same Code? // Psychological Bulletin. Vol. 129. - 2003, № 5. - 770-814.

[12] Metfessel M. The vibrato in artistic voices // University of Iowa studies in the psychology of music. - Iova city: University of Iowa press. 1932, vol.1. The vibrato. - 14-117.

[13] Rapoport E. Emotional expression code in opera and lied singing // Journal of New Music Research. - 1996, № 25. - Р. 109-149.

[14] Scherer K.R. Expression of emotion in voice and music // Journal of voice. - 1995, № 9. - 235-248.

[15] Sherman, M. Emotional character of the singing voice // Journal of experimental psychology. - 1928, № 11. -P. 355-369.

[16] Siegwart H., Scherer K.R. Acoustic concomitants of emotional expression in operatic singing: The case of Lucia in Ardi gli incense //. Journal of Voice. - 1995, № 9. - Р. 249-260.

[17] Sundberg J., Iwarsson J., Hagegard H. A singer expression of emotions in sung performance // STL-QPSR. -1994, vol. 35 2-3. - Р. 81-92.

[18] Sundberg J. Science of the singing voice. - Northern Illinois University Press, 1989.

Общество