Автореферат диссертации по теме "Акустические характеристики гласных звуков "говорящих" птиц"

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

Уплисова Ксения Олеговна

Акустические характеристики гласных звуков «говорящих» птиц

19 00 02 - психофизиология

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук

003059630

Работа выполнена на кафедре высшей нервной деятельности и психофизиологии биолого-почвенного факультета Санкт-Петербургского государственного университет в лаборатории физиологии сенсомоторных систем НИИ физиолот ии им академика А А Ухтомского

Научный руководитель.

Доктор биологических наук, профессор Куликов Геннадий Аркадьевич

Официальные оппоненты

Доктор биологических наук, профессор Черниговская Татьяна Владимировна Кандидат биологических наук, доцент Итьинский Иван Владимирович

Ведущая организация

Институт эволюционной физиоло! ии и биохимии им И М Сеченова РАН

Зашита состоится « » марта 2007 года в $v¿}ücob на заседании Диссертационного совета Д 212 232 10 по защите диссертаций на соискание ученой степени доктора биологических наук при Санкт-Петербургском государственном университете (199034, Санкт-Петербург, Университетская наб , 7/9, ауд 90)

С диссертацией можно ознакомиться в библиотеке им А М Горького Санкт-Петербургского государственного университета

Авюреферат разослан № 2007 года

Ученый секретарь

диссертационного совета, д б н , проф

Н П Алексеев

ВВЕДЕНИЕ

Актуальность проблемы распознавания и восприятия речи человеком отражена в большом количестве работ, посвященных разработке этих вопросов В последнее время интерес многих исследователей сконцентрировался вокруг мозговой организации речевой функции разработке теорий распознавания речи, особенностей, связанных с распознаванием речи правым и левым полушарием, а также функциональном картировании мозга, при решении им различных задач (Вартанян и др , 1988, Вартанян, 1988, Бехтерева, 1999, Черниговская, 2004, Chernigovskaya, 1994, Pulvermueller, 1999) Однако, несмотря на длительное исследование, до сих пор многие аспекты восприятия и распознавания речи остаются невыясненными, например, каким образом человек отличает звуки одной фонетической категории от другой Согласно классическим представлениям (Фланаган, 1968, Фант, 1970) ключевыми признаками различных фонетических категорий гласных звуков являются частоты первой, второй и, иногда, третей формант, отражающих резонансные частоты голосового тракта человека Для каждой категории гласного значения частот первой и второй формант являются стабильными, и их значения не пересекаются со значениями формант звуков другой категории (Peterson, Barney, 1952) Однако, например, форманты звуков с высокой частотой основного тона (выше 300 Гц), присутствующих в гласноподобных вокализациях младенцев и звуках вокальной речи, не попадают в фаницы, определенные для звуков речи взрослого диктора Тем не менее, подобные гласные идентифицируются аудиторами с высокой вероятностью (Куликов и др , 1999, Андреева, Куликов, 2003)

В связи с этим, особенно интересной представляется способность некоторых видов птиц имитировать человеческую речь Ведь для этого птице необходимо, несмотря на индивидуальные различия голосов окружающих её людей и характеристики своей слуховой системы, настроенной на особенности видоспецифических сигналов, выделить те акустические признаки, на основании которых она создаст копию звука, слова или фразы Строение звукогенерирующего аппарата птиц также существенно отличается от человеческого (Nowicki, Capranica, 1986, Goller, Larsen, 2002, Gaban-Lima, Höfling, 2006) и, следовательно, его резонансные характеристики не могут быть такими же как у человека Более того, некоторые виды птиц используют при звукогенерации два источника звуковых колебаний Так как звуки речи, имитируемые птицами, адекватно распознаются человеком, естественно предположить, что в них

сохраняются акустические признаки, позволяющие отнести звук к той или иной категории

В немногочисленных работах по исследованию акустической структуры звуков, имитируемых различными птицами, были получены противоречивые данные (Силаева, 1998, Ильичев и др, 1999, Андреева, 2001, Klatt, Stefanski, 1974, Patterson, Pepperberg, 1994, Banta Lavenex, 1999) В работе по исследованию речеподобных звуков из имитационного репертуара серого попугая (Patterson, Pepperberg, 1994) было выявлено, что категории гласных невозможно разделить на основании значений первой и второй формант Однако, свидетельств использования попугаем более чем одного источника основного тона при генерации этих звуков получено не было И, так как, оказалось, что произнесение различных гласных связано с изменением птицей положения языка, авторы предположили, что попугай использует механизмы звукогенерации и модификации акустической картины звуков, сходные с человеческими Однако при исследовании имитаций речи скворцом-майной в нижней гортани которого два источника основного тона, были получены свидетельства способности этой птицы к довольно точному копированию частоты основного тона и частоты формант звуков человека (Klatt, Stefanski, 1974)

Таким образом, остается неясным, каким образом птицы могут имитировать речь звукогенерирующим аппаратом отличным от человеческого, и на основании чего человек различает гласные, имитируемые птицами, которые не имеют различительных признаков, соответствующих классической теории речеобразования

Цель исследования - определение акустических характеристик гласных звуков различных фонетических категорий, имитируемых различными птицами, выявление общих акустических признаков для звуков одной фонетической категории, генерируемой птицами разных видов и человеком

Задачи исследования 1. Осуществить спектральный анализ акустических характеристик гласноподобных звуков «говорящих» птиц различных видов

2 Провести внутри- и межвидовое сравнение акустических характеристик гласноподобных звуков, произносимых различными птицам

3 Сравнить акустические характеристики гласных, произносимых попугаем и обучающим его человеком

4 Путем модификации спектральных компонентов, выявить их значимость для идентификации фонетической категории звука, имитируемого птицей

Основные положения, выносимые на защиту

1 У «говорящих» птиц независимо от способа звукогенерации и четкости произнесения, фонетические категории имитируемых гласных звуков, невозможно разделить на основании признака, стабильного для различных категорий гласных звуков человека

2 Характер огибающей спектра позволяет разделить фонетические категории звуков, имитируемые каждой из исследованных птиц

3 Выявленные особенности огибающей спектра различных фонетических категорий гласных звуков, имитируемых птицами, характерны также и для гласных звуков человека

Научная новизна результатов В работе впервые проведен детальный спектральный анализ различных категорий гласных звуков русского языка «говорящих» птиц разных видов В результате сравнительного анализа этих звуков с гласными звуками человека были выявлены особенности, характеризующие фонетические категории гласных независимо от способов генерации А в результате психоакустического эксперимента была показана роль спектральных компонентов, находящихся в различных частотных диапазонах, для фонетической оценки звуков

Научно-практическая ценность работы. В результате исследования были выявлены акустические признаки фонетических категорий гласных общие для исследованных птиц и человека Полученные данные могут иметь существенное значение для понимания психофизиологических основ восприятия фонетических категорий гласных как людьми, так и животными Знание универсальных особенностей фонетических категорий звуков может способствовать развитию систем автоматического распознавания речи

Апробация диссертационной работы. Материалы работы были представлены на XII и XIII международных совещаниях по эволюционной физиологии (СПб, 2001, 2006), конференции «Мозг и поведение» (СПб, 2001), молодежной конференции «Человек и его здоровье» (СПб, 2002), международной конференции «Акустика детской речи» (СПб, 2002), XIII и XVI сессиях Российского Акустического Общества (Москва, 2003, 2005), конференциях «Физиология слуха и речи» (СПб, 2003, 2005)

Выполнение исследований было поддержано стипендиями президента Российской Федерации (2005-2006) и Американского акустического общества (2006 - RX0-121-XX-03), персональными фантами для студентов, аспирантов и молодых специалистов за 2002 и 2003 года (№ М02-2 6Д-485 и № МОЗ-2 6Д-227), персональным фантом для аспирантов Федерального агентства по образованию за 2004 год (№ А04-2 12-631), федеральной целевой программой «Государственная поддержка интефации высшего образования и фундаментальной науки» на 1997-2000 годы, профаммой Минобразования «Университеты России» № 992616, 2000-2001 гг, грантом Российского Фонда Фундаментальных исследований № 02-06-80275, 2002-2004 гг, ведомственной научной профаммой Минобразования России «Развитие научного потенциала высшей школы» №4727, 2005 г

Публикации По теме диссертации опубликовано 3 статьи (2 в рецензируемых журналах) и 9 тезисов докладов

Объем и структура работы Работа состоит из введения, четырех глав, выводов и списка литературы, включающего в себя 171 библиофафическую ссылку (126 на иностранных языках) Работа изложена на 157 страницах машинописного текста, содержит 32 рисунка и 4 таблицы

МАТЕРИАЛ И МЕТОДЫ ИССЛЕДОВАНИЯ

Исследовались имитации речи пяти птиц трех серых попугаев (Psittacus enthacus) Ромы, Кузи и Киры, волнистого попугайчика (Melopsittacus undulatus) Геши и скворца-майны (Gracula religiosa) Чики Количество выделенных звуков представлено в таблице 1 С целью сравнения акустических характеристик имитаций слов птицами с речью человека была осуществлена аудиозапись хозяина волнистого попугайчика Геши

Таблица 1

Количество выделенных гласноподобных звуков

Рома Кузя Кира Геша Чика

всего 219 786 593 968 124

«а» 95 303 270 384 47

«о» 98 53 81 59 32

«у» - 102 75 38 _

«и» 26 170 167 163 45

другие - 158 - 324 -

Из всего вокального репертуара птиц выделялись имитации слов человеческой речи Выделение гласных звуков осуществлялось на слух (на основании однородности звучания выделенного фрагмента), по однородности динамической спектрограммы и амплитудно-динамической формы сигнала Спектральный анализ звуковых сигналов осуществлялся на основе быстрого преобразования Фурье, данные взвешивались с помощью окна данных Хемминга с 1024 отсчетами (ширина усредняемой полосы 43 Гц)

В связи с тем, что спектры гласноподобных звуков, в большинстве случаев, не являлись гармоническими, определялась частота и амплитуда всех спектральных компонентов, необходимых для описания контура огибающей спектра, начиная с первой составляющей, превышающей уровень шума, и до момента исчезновения выраженных компонентов В спектре каждого звука выделялись до трех формант (спектральных максимумов) Из амплитуды каждого спектрального компонента вычиталась амплитуда первого спектрального компонента, превысившего уровень шума Значения разности амплитуд для всех спектральных компонентов звуков, отнесенных к единой фонетической категории, распределялись по частотным диапазонам, соответствующим критическим полосам слуха человека (Цвикер, Фельдкеллер, 1965) и в каждой критической полосе определялась их медиана На основании полученных значений определялась зависимость разности амплитуд спектральных компонентов от их частоты Достоверность различий разности амплитуд в каждой критической полосе определялась по критерию Колмогорова-Смирнова

400 звуков серого попугая Кузи и 500 звуков волнистого попугайчика Геши были подвергнуты аудиторскому анализу Серия звуков, предназначенная для прослушивания, состояла из пятидесяти гласноподобных, каждый из которых повторялся по три раза с интервалом 400 мс, различные звуки были разделены интервалом в полторы секунды Серии предъявлялись группам студентов, ранее в подобных экспериментах не участвовавших Достоверность идентификации звука определялась по биномиальному критерию

С целью выявления значимости частоты и амплитуды различных спектральных компонентов для отнесения звука к той или иной фонетической категории, была проведена модификация серии звуков С помощью фильтра быстрого преобразования Фурье (FFT фильтр, программа Cool Edit Pro) производились изменения амплитуды спектральных составляющих Модифицированные звуки идентифицировались группой из пяти-семи опытных аудиторов Перед ними

ставилась задача обозначить изменил ли модифицированный звук категорию по сравнению с категорией не модифицированного звука и каким образом

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ 1. Сравнительная характеристика акустической структуры имитаций речи различными птицами

В работах по исследованию акустической структуры имитаций речи различными птицами было выявлено, что имитации серого попугая (Patterson, Pepperberg, 1994) и скворца-майны (Klatt, Stefanski, 1974) имеют гармоническую структуру, а волнистого попугайчика - негармоническую (Banta Lavenex, 1999) В первом случае это может свидетельствовать об использовании птицами одного источника звуковых колебаний, а во втором - двух

В данном исследовании гласноподобные звуки серых попугаев могли иметь гармоническую и негармоническую структуру Гармонические гласноподобные (частота основного тона 150-250 Гц) встречались у Ромы и Киры, у Кузи же практически отсутствовали У волнистого попугайчика Геши практически все звуки были негармоническими и амплитудно-модупированными Модулирующая частота была определена в 95% сигналов и составляла 90-140 Гц Несущая частота у 54% звуков составляла 3-3,5 кГц, и у 32% - 2,5 кГц В оставшихся случаях она составляла 1-1,5 кГц, и изредка вообще не определялась Гласноподобные звуки майны Чики могли быть гармоническими и негармоническими В случае гармонической структуры частота основного тона составляла от 150 до 400 Гц При частоте 150-200 Гц длительность периодов основного тона приобретала неравномерный характер

Полученные данные позволяют предположить, что «говорящие» птицы могут использовать различные способы звукогенерации Возможно, некоторые птицы используют преимущественно один из этих способов, в результате чего данные разных исследований будут отличаться

2 Особенности идентификации различных категорий гласноподобных звуков «говорящих» птиц

В результате аудиторского анализа были выделены звуки, относимые к определенной категории независимо от слухового опыта и информации о контексте, из которого звук был выделен Это позволяло предположить, что в подобных звуках акустические характеристики фонетической категории будут выражены в большей степени по сравнению со звуками, которые

идентифицировались автором данного исследования, но аудиторами достоверно определены не были

Средний уровень идентификации всех категорий гласных (табл 2) серого попугая Кузи оказался выше (41%-62%), чем гласных волнистого попугайчика Геши (26%-53%) Уровень идентификации категории «и» был наибольшим по отношению к другим категориям для обеих птиц (62% у Кузи и 53% у Геши) У обеих птиц с наименьшим уровнем были идентифицированы звуки категории «у» Если предъявляемый звук достоверно относился аудиторами к двум категориям, у обеих птиц в значительном количестве присутствовали пары «а» - «о» (45% всех звуков, отнесенных к двум категориям, попугая Кузи и 25% звуков Геши) Однако у Геши чаще всего встречались пары «а» - «и» (28% от всех звуков, отнесенных к двум категориям)

Таблица 2

Количество предъявленных и идентифицированных аудиторами гласных звуков Кузи и Геши

Предъявлено (кол-во звуков) Идентифицировано (кол-во звуков) Средний процент идентификации + среднее отклонение %

Кузя

Всего 400 303

«а» 163 78 50+13

«о» 40 24 51+12

«у» 51 34 41+12

«и» 103 108 62+16

другие 43 59

«и» другие

500 225 46 34 111 84

430 135 10 2

46+11 37+8 26+2 53+14

Высокий уровень идентификации звуков, относящихся к категории «и», можно объяснить тем, что они имели энергетически выраженный максимум в высокочастотной области, не перекрывающийся со спектральными компонентами звуков других категорий Звук «и», основные спектральные компоненты которого располагаются в высокочастотной области, может легче генерироваться птицами в связи с их незначительными размерами и следовательно меньшей звукогенерующей системой Низкий уровень идентификации звуков категории «у» может быть связан с обратной ситуацией, так как из четырех категорий гласных для «у» характерны наиболее низкие по частотам спектральные составляющие

3 Анализ значений частоты и амплитуды первой и второй формант

Гласные, относящиеся к одной категории у каждой птицы могли быть одно-, двух- и трехформантными, поэтому определялась частота встречаемости формант в определенных частотных диапазонах У каждой птицы оказалось, что наиболее часто форманты звуков разных категорий присутствуют в различных частотных диапазонах Однако для одной категории, генерируемой разными птицами эти диапазоны также были различны Данные анализа значений формант представлены в таблице 3

Таблица 3

Значения медианы первой и второй форманты для четырех _категорий гласных различных птиц__

«а» «о» «V» «и»

Рома

Медиана Р1 Гц 809 604 - 434

25-ый персентиль, Гц 730 531 419

75-ый персентиль, Гц 901 755 1841

Медиана Р2, Гц 1424 950 - 2671

25-ый персентиль, Гц 1195 819 2324

75-ый персентиль Гц 1545 1044 2939

Кузя

Медиана Р1, Гц 1369 805 546 2451

25-ый персентиль Гц 903 711 470 2407

75-ый персентиль Гц 1417 1112 625 2602

Медиана Р2, Гц 2407 1924 1161 -

25-ый персентиль, Гц 1560 1397 1026

75-ый персентиль, Гц 2609 2486 1518

Кира

Медиана Р1, Гц 861 603 603 2412

25-ый персентиль, Гц 732 603 431 797

75-ый персентиль, Гц 1163 646 646 2670

Медиана Р2, Гц 1637 2455 3876 3445

25-ый персентиль, Гц 1432 1292 3208 2799

75-ый персентиль, Гц 2143 3671 4005 4091

Геша

Медиана Я1, Гц 1313 999 418 2413

25-ый персентиль Гц 693 811 418 2217

75-ый персентиль, Гц 1470 1038 418 2611

Медиана Р2, Гц 2243 2531 1398 3113

25-ый персентиль, Гц 1466 2436 1398 2513

75-ый персентиль, Гц 2587 2623 1398 3526

Чика

Медиана Р1, Гц 692 694 - 470

25-ый персентиль Гц 566 648 379

75-ый персентиль, Гц 738 727 519

Медиана Р2, Гц 1223 979 _ 2056

25-ый персентиль, Гц 928 847 1925

75-ый персентиль, Гц 1419 1062 2323

Распределения значений частот первой и второй формант на двухформантной плоскости для различных категорий гласных звуков у всех птиц перекрывались Категории гласных звуков попугаев Кузи и Геши, достоверно отнесенные к той или иной фонетической категории группой аудиторов, также не разделялись на основании значений частот первой и второй форманты Только у попугая Ромы можно было выделить области, в которых преимущественно присутствовали значения формант определенной категории гласного Однако эти области не соответствовали областям, занимаемым звуками человеческой речи, и отличались только по значениям второй форманты

В связи с имеющимися данными о возможности разделения категорий гласных звуков при учете амплитуды формант (Куликов и др, 2002) была проведена попытка разделения категорий гласных звуков на основании значений частот первой форманты и разности амплитуд первой и второй форманты (только в случае двухформантных звуков) Использование амплитудных значений формант совместно с частотными позволило разделить две из трех категорий («а» и «о») серого попугая Ромы, однако для всех категорий гласных, имитируемых остальными птицами, не дало результата

Таким образом, у «говорящих» птиц различных видов гласные звуки независимо от четкости произнесения оказалось невозможно разделить на основании признака стабильного для гласных звуков человека — значений частоты формант

4 Анализ значений всех спектральных компонентов

В связи с тем, что различные категории гласноподобных звуков «говорящих» птиц оказалось невозможно разделить на основании значений частот и амплитуд первых двух формант, была проведена попытка разделить категории с учетом амплитудных и частотных значений всех спектральных компонентов Наличие особенностей огибающей спектра у различных фонетических категорий было ранее выявлено для гласноподобных звуков младенцев (Андреева, 2001, Куликов и др, 2002) Распределения зависимости разности амплитуд спектральных компонентов от их частоты отражали характер огибающей спектра звуков, наличие в нем формантных максимумов и их относительные амплитуды (рис 1)

Для серого попугая Ромы энергетически выраженные спектральные компоненты звука «о» занимали более узкую частотную полосу по сравнению со звуком «а» Амплитуда спектральных компонентов звука «о» начинала уменьшаться с девятой полосы (с 915 Гц), тогда как для звука «а» сохранялась до

12 полосы (до 1720 Гц). Наибольшее количество отличий разности амплитуд спектральных компонентов звука «и» от звуков «а» и «о» пришлось на 14—17 критические полосы (1990-3675 Гц). В этом диапазоне в спектре звуков «и» присутствовали наиболее энергетически выраженные спектральные компоненты.

Волнистый шшугяйчнк Гены

Серый попугай Рома

Серый попутай Кузя

4« Й 20

Скворец-иаина Чика

Критические полосы

Серый попугай [Сира

Рис. 1. Зависимость разности амплитуд от частоты спектральных компонентов для гласных звуков различных птиц

По оси абсцисс - номера критических полос, по оси ординат - медианы разности амплитуд, дЬ

Критические полосы

У попугая Кузи распределения зависимости разности амплитуд спектральных компонентов от их частоты для звуков «а» и «о» имели наименьшее количество различий по сравнению с аналогичными звукам/ других птиц, несмотря на то, что эти звуки были достоверно идентифицированы большой группой аудиторов. У «а» и «о» энергетически выраженные спектральные компоненты присутствовали в 7-6

критических полосах (630-915 Гц) отличаясь только по амплитуде Второй максимум для звука «о» находился в 10-11 (1080-1480 Гц) критических полосах, а для звука «а» в 11-12 (1480-1720 Гц) критических полосах Для звука «у» выраженные спектральные компоненты занимали непрерывный диапазон 7—11 критических полос, но их относительные амплитуды были ниже чем в соответствующих полосах для звуков «а» и «о» У всех трех категорий присутствовал максимум в 15 критической полосе (2310-2690 Гц) В диапазоне 13-15 критических полос находился единственный выраженный максимум, характеризующий спектр звуков категории «и»

Для попугая Киры были получены наиболее четкие различия между четырьмя категориями гласных Энергетически выраженные компоненты звука «у» занимали 6-7 критическую полосу, звука «о» - 6-9 полосы, звука «а» - 7-13 критические полосы Звук «и» характеризовался максимумом в 14-17 критических полосах

Для волнистого попугайчика Геши анализировались распределения, построенные на основании всех выделенных звуков, относящихся к четырем фонетическим категориям У всех категорий наиболее выраженные спектральные компоненты занимали диапазон 14-16 критической полосы В этой области находилась единственная форманта звука «и» и наиболее энергетически выраженные форманты для остальных категорий звуков Для категорий «а» и «о» присутствовали форманты и на более низких частотах У звука «а» присутствовали форманты в 7 (630-770 Гц) и 11 (1260-1480 Гц) критических полосах, у звука «о» в 9-10 (1080-1260 Гц) критических полосах У звука «у» присутствовал слабо выраженный максимум в 5 критической полосе

Звук «а» скворца Чики был двухформантным, спектральные максимумы присутствовали в 7 и 11 критических полосах, а для звука «о» единственная форманта находилась в 7 критической полосе У звука «и» спектральные максимумы присутствовали в 5, 8—9 и 14 критических полосах

Для всех птиц достоверные отличия амплитуд между категориями «а» и «о» пришлись на 11-13 критические полосы (частотный диапазон 1260-1990 Гц), для серых попугаев отличия также были в 10 критической полосе (1080-1260 Гц) То есть в этой частотной области у категории «а» присутствовали энергетически выраженные спектральные компоненты отсутствующие у категории «о» Отличия категории «и» от остальных категорий у всех птиц пришлись на 14-17 (1990-3675 Гц) критическую полосу

Таким образом учет значений частоты и амплитуды всех спектральных компонентов звуков позволил выявить различия между звуками, относящимися к категориям «а», «о», «у» и «и», а именно присутствие энергетически выраженных спектральных компонентов у звуков категории «у» в 6-7 критической полосе, «о» -в 7-10 критической полосе, «а» - в 11-13 критических полосах, «и» - 14-16 критических полосах

5 Особенности гласных звуков человека

Значения частот формант различных категорий гласных звуков хозяина Геши, выделенных из слов, произнесенных при взаимодействии с попугаем, занимали на двухформантной плоскости практически не перекрывающиеся области Значения формант для звука «а» были смещены на 200-300 Гц в низкочастотную область относительно нормативных значений (Чистович и др, 1967), значения первой форманты составляли от 500 до 700 Гц Области распределения значений частот формант звуков «о» и «у» частично перекрывались в связи с тем, что частота первой форманты звуков категории «о» оказалась ниже нормативных значений на 100 Гц Частоты формант категории «у» с нормативными совпадали Изменения значений частот формант в гласных, произнесенных при взаимодействии с птицей по сравнению с произносимыми в обычной речи, зафиксировано не было

Для хозяина волнистого попугайчика Геши были построены распределения зависимости медиан разности амплитуд спектральных компонентов от их частоты (рис 2) Распределение категории гласного «а» имело два максимума в 6 (510-630 Гц) и 11 (1260-1480 Гц) полосах Для «о» - в 5 (400-510 Гц) и 8 (770-915 Гц) полосах, для «и» - в 4 (300-400 Гц) и 14-16 (1990-3125 Гц) полосах Эти значения соответствовали частотам формант для каждой категории гласного

2 4 6 8 10 12 14 16 18 20 Критические полосы

Рис. 2 Зависимость разности амплитуд от частоты спектральных компонентов для гласных звуков хозяина волнистого попугайчика Геши

Обозначения такие же как на рис 1

Таким образом, выявленные для категорий гласных звуков «говорящих» птиц особенности огибающей спектра, также присутствуют в огибающей спектра звуков человека Для гласноподобных звуков птиц эти особенности отражают распределение наиболее энергетически выраженных спектральных компонентов в определенных частотных диапазонах, для гласных звуков человека - характерное расположение второго спектрального максимума (форманты)

6 Особенности идентификации гласноподобных звуков при их модификации

С целью выявления особенностей спектра, позволяющих идентифицировать звук как относящийся к той или иной фонетической категории, была проведена модификация частоты и амплитуды спектральных компонентов звуков серого попугая Кузи и волнистого попугайчика Геши Модифицированные звуки идентифицировались группой из пяти-семи аудиторов, постоянно участвующих в подобных экспериментах

Выявленные особенности восприятия категории модифицированного гласного оказались таковы

если в спектре звука присутствуют выраженные спектральные компоненты в диапазоне 1300-1700 Гц, этот звук будет с высокой вероятностью идентифицирован как «а», независимо от того присутствуют ли выраженные спектральные компоненты на низких и высоких частотах,

если частоты основных энергетически выраженных компонентов находятся ниже 1000 Гц, то звук будет идентифицирован как «о», независимо от присутствия выраженных спектральных компонентов выше 1700 Гц, но не в случае их наличия в диапазоне 1300-1700 Гц,

при наличии спектральных компонентов в диапазоне 1100-1300 Гц, звук может идентифицироваться и как «а» и как «о»,

в случае наличия энергетически выраженных спектральных компонентов с частотой ниже 500 Гц и при отсутствии выраженных спектральных компонентов на более высоких частотах звук будет идентифицироваться как «у»,

в случае одновременного присутствия выраженных спектральных компонентов с частотой ниже 500 Гц и выше 1700 Гц, звук будет идентифицироваться как «и», также он будет идентифицироваться, если выраженные спектральные компоненты будут присутствовать только начиная с 1700 Гц

Таким образом, результаты проведенных экспериментов по модификации спектральных компонентов подтверждают данные о наличии критических отличий

между категориями звуков «а» и «о» в частотном диапазоне 1260-1990 Гц (11-13 критические полосы)

В целом результаты исследования свидетельствуют о невозможности разделения фонетических категорий гласных звуков, имитируемых «говорящими» птицами, на основании признака адекватного для гласных человека Проведенный анализ значений частоты и амплитуды спектральных компонентов, а также их модификация свидетельствует о значимости присутствия выраженных спектральных компонентов в определенных частотных диапазонах для идентификации различных гласноподобных звуков птиц

Полученные данные об отличиях огибающей спектра категорий звуков «а», «о» «и», имитируемых различными птицами, совпадают с данными, полученными для гласных и гласноподобных звуков детей, которые также не разделяются на основании значений формант (Куликов и др , 2002) Так как сходные особенности можно обнаружить в огибающих спектра звуков «а», «о», «и» человеческой речи, скорее всего, выявленные отличия являются универсальными для звуков этих категорий независимо от условий генерации Возможно, именно этот признак используется при восприятии для идентификации гласных звуков, в случае если значений частот формант для этого недостаточно

1 Гласноподобные звуки, присутствующие в имитационном репертуаре исследованных птиц, независимо от четкости копирования, могут иметь гармоническую и негармоническую структуру

2 Звуки одной категории, имитируемой птицей, могут иметь различное количество формант В связи с отсутствием стабильности формантной картины разделение различных категорий гласных звуков на основе значений частоты первой и второй форманты невозможно

3 Распределения зависимости разности амплитуд спектральных компонентов от их частоты для различных категорий гласных звуков у всех исследованных птиц имеют определенные особенности для идентификации категории «и» существенным является присутствие спектрального максимума на частотах выше 1700 Гц, отличия между категориями «о» и «а» заключаются в присутствии у категории «а» энергетически выраженных спектральных компонентов в диапазоне 1300-1700 Гц, тогда как у категории «о» они отсутствуют

4 Особенности характера распределения зависимости разности амплитуд спектральных компонентов от их частоты для каждой категории гласного, имитируемого различными птицами, не зависят от их принадлежности к одному или разным видам

5 Наличие выраженных спектральных компонентов в диапазоне 1300-1700 Гц у звуков категории «а» по сравнению со звуками категории «о», и спектрального максимума в диапазоне 2000-3000 Гц для звуков категории «и» также характерно для распределений зависимости разности амплитуд спектральных компонентов от их частоты фонетических категорий звуков человека

Основные результаты диссертации опубликованы в следующих работах

1 Куликов Г А , Андреева Н Г , Самокищук А П Уплисова К О Биологические основы развития речи и довербальные вокализации // Материалы XII международного совещания по эволюционной физиологии, СПб АМК МарКо, 2001 - С 76-77

2 Уплисова КО Акустические характеристики гласноподобных звуков птиц-пересмешников // Сборник трудов XIII сессии Российского Акустического Общества, Москва ГЕОС, 2003 -Т 3 - С 157-161

3. Уплисова К.О. Характеристики гласных звуков имитируемых говорящими птицами II Сенсорные системы - 2004. - Т.18, №3. - С 199205

4 Уплисова К О Акустические характеристики гласноподобных звуков говорящего серого попугая (РэМасиэ еп1Ьасиз) II Нервная система - 2005 -Т 38 - С 68-75

5 Уплисова К О Акустические характеристики гласноподобных звуков говорящего серого попугая И Сборник трудов XVI сессии Российского Акустического Общества, Москва ГЕОС, 2005 -Т 3 - С 96-99

6 Уплисова К О Акустический анализ гласных звуков говорящего волнистого попугайчика и обучавшего его человека // Материалы XIII международного совещания по эволюционной физиологии, СПб ВВМ, 2006 - С 219

7 Уплисова КО Акустический и аудиторский анализ гласноподобных звуков серого (РвМасиэ сп^асиэ) и волнистого {Ме1орзШасиз ипсМаШв) попугаев II Сенсорные системы. - 2006. - Т.20, №3. - С. 229237.

Подписано в печать 09 02 2007 Формат 60x84 1/16. Бумага офсетная Печать офсетная Уел печ л 1,0 Тираж 75 экз Заказ № 453

Отпечатано в ООО «Издательство "ЛЕМА"»

199004, Россия, Санкт-Петербург, В О , Средний пр , д 24, тел /факс 323-67-74 e-mail izd_lema@mail ru

Содержание диссертации автор научной статьи: кандидат биологических наук , Уплисова, Ксения Олеговна, 2007 год

Введение

1. Обзор литературы

1.1. Особенности вокального обучения у певчих воробьиных и попугаев

1.1.1. Акустическая коммуникационная система.

1.1.2. Развитие песни певчих воробьиных.

1.1.3. Формирования контактных сигналов у попугаев

1.1.4. Особенности организации вокальных центров

1.1.5. Пересмешничество

1.2. Восприятие звуковых сигналов человеком и птицами

1.2.1. Характеристики слуха человека и восприятие речевых звуков

1.2.2. Характеристики слуха певчих воробьиных и попугаев и восприятие ими видовых сигналов

1.2.3. Восприятие птицами звуков человеческой речи

1.3. Механизмы звукогенерации у человека и птиц

1.3.1. Строение и функционирование голосового аппарата человека

1.3.2. Строение и функционирование голосового аппарата певчих воробьиных и попугаев

1.3.3. Генерация птицами звуков человеческой речи

Введение диссертации по психологии, на тему "Акустические характеристики гласных звуков "говорящих" птиц"

Актуальность проблемы распознавания и восприятия речи человеком, отражена в большом количестве работ, посвященных разработке этих вопросов. В последнее время интерес многих исследователей сконцентрировался вокруг мозговой организации речевой функции: разработке теорий распознавания речи, особенностей, связанных с распознаванием речи правым и левым полушарием, а также функциональном картировании мозга, при решении им различных задач (Вартанян И.А. и др., 1988; Вартанян И.А., 1988; Бехтерева Н.П., 1999; Черниговская Т.В., 2004; Chernigovskaya Т., 1994; Pulvermueller F., 1999). Однако, несмотря на длительное исследование, до сих пор многие аспекты восприятия и распознавания речи остаются невыясненными, например, каким образом человек отличает звуки одной фонетической категории от другой. Возникшая в 60-х-70-х годах теория речеобразования (Фланаган Дж., 1968; Фант Г., 1970) считается классической. Согласно этим представлениям ключевыми признаками различных фонетических категорий гласных звуков являются частоты первой, второй и, иногда, третей формант. Для каждой категории гласного значения частот первой и второй формант являются стабильными, и их значения не пересекаются со значениями формант звуков другой категории. Однако почти одновременно с возникновением этой теории, были выявлены многочисленные факты ее не подтверждающие. Среди них, большое количество несоответствий значений формант категорий звуков, произносимых различными людьми, с определенными в лабораторных условиях (Варшавский Л.А., Литвак И.М., 1955). Форманты звуков с высокой частотой основного тона (выше 300 Гц), присутствующих в гласноподобных вокализациях младенцев и звуках вокальной речи, также не попадают в границы, определенные для звуков речи взрослого диктора. Тем не менее, проблем с определением фонетической категории у подобных гласных не возникает (Куликов Г.А. и др., 1999; Андреева Н.Г., Куликов Г.А., 2003). Для решения проблемы разделения категорий гласных звуков предлагаются различные дополнения к основной формантной теории, в том числе предлагающие учитывать не только частотные, но и амплитудные значения формант, или же всю огибающую спектра (Куликов Г.А. и др., 1999; Андреева Н.Г., Куликов Г.А., 2003; Ito М. et al., 2001). Однако, пока не получено доказательств универсальности какого-либо из предлагаемых признаков для разделения категорий гласных звуков независимо от условий их генерации.

В связи с этим, особенно интересной представляется способность некоторых видов птиц имитировать человеческую речь. Ведь для этого птице необходимо, несмотря на индивидуальные различия голосов окружающих её людей и характеристики своей слуховой системы, настроенной на особенности видоспецифических сигналов, выделить те акустические признаки, на основании которых она создаст копию звука, слова или фразы. Так как звуки речи, имитируемые птицами, адекватно распознаются человеком, естественно предположить, что в них сохраняются акустические признаки, позволяющие отнести звук к той или иной категории.

В серии работ было показано, что некоторые виды птиц различают фонетические категории звуков речи. Для восприятия ими категорий гласных существенное значение имеют частотные значения формант (Hienz R.D. et al., 1981), а согласных - время включения основного тона

Dooling R.J. et al., 1989) и изменение значений частот формант (Dooling R.J. et al., 1995). Это позволяет предположить, что частотные и временные характеристики, ключевые для различных фонетических категорий, могут восприниматься некоторыми видами животных несмотря на то, что акустические особенности их видовой системы коммуникации отличны от характеристик речи. В частности, основной частотный диапазон видоспецифических вокализаций птиц составляет 2-4 кГц. Однако частоты формант большинства звуков речи, генерируемых человеком, не превышают 2 кГц.

Обратная ситуация, а именно восприятие человеком звуков, имитируемых птицами, также удивительна. Многие акустические особенности звуков речи связаны со строением звукогенерирующего аппарата человека. Частоты формант отражают резонансные характеристики гортани, глотки, ротовой и носовой полости. Частота колебания голосовых складок определяет частоту основного тона, на слух воспринимаемую как высота голоса. Более короткие голосовые складки у женщин по сравнению с мужчинами приводят к более высокому голосу. Строение звукогенерирующего аппарата птиц существенно отличается от человеческого, и, следовательно, его резонансные характеристики не могут быть такими же, как у человека. Более того, некоторые виды птиц используют при звукогенерации два источника звуковых колебаний. В немногочисленных работах по исследованию акустической структуры звуков, имитируемых различными птицами были получены противоречивые данные (Силаева O.JL, 1998; Ильичев В.Д. и др., 1999; Banta Lavenex P., 1999; Klatt D.H., Stefanski R.A., 1974; Patterson D.K., Pepperberg I.M., 1994). В работе по исследованию речеподобных звуков из имитационного репертуара серого попугая (Patterson D.K., Pepperberg I.M., 1994) было выявлено, что различные категории гласных английского языка, имитируемые этой птицей, невозможно разделить на основании значений первой и второй формант. Однако, свидетельств использования при генерации звуков попугаем более чем одного источника основного тона получено не было. И, так как, было зафиксировано, что произнесение различных гласных связано с изменением птицей положения языка, авторы предположили, что попугай использует механизмы звукогенерации и модификации акустической картины звуков, сходные с человеческими.

В последнее время появились данные, свидетельствующие о том, что у волнистых попугайчиков, также хорошо известных имитаторов (Banta Lavenex P., 1999), акустическая структура имитаций речи и их видовых сигналов, в значительном количестве случаев, является следствием работы двух нелинейно связанных источников звуковых колебаний. Их местоположение, на данный момент, обсуждается. Вместе с этим существенных отличий анатомии сиринкса в группе попугаев не выявлено (Gaban-Lima R., Hofling Е., 2006). Это позволяет предположить, что подобный способ звукогенерации возможен и у более крупных представителей группы попугаев.

Помимо попугаев имитировать речь способны некоторые виды птиц, относящиеся к певчим воробьиным, например, вороны и скворцы. В нижней гортани птиц этого подотряда присутствуют два независимых источника колебания - по одному в каждом бронхе. Тем не менее, для имитаций речи некоторыми из этих видов характерно высокое сходство с человеческим голосом.

Таким образом, остается неясным, каким образом птицы могут имитировать речь звукогенерирующим аппаратом отличным от человеческого, и на основании чего человек различает гласные, имитируемые птицами, которые не имеют различительных признаков, соответствующих классической теории речеобразования. Это позволяет предположить, что особенности фонетических категорий гласных выходят за рамки значений первой и второй формант.

Цель исследования. Целью исследования являлось: определение акустических характеристик гласных звуков различных фонетических категорий, имитируемых различными птицами; выявление общих акустических признаков для звуков одной фонетической категории, генерируемой птицами разных видов и человеком. Задачи исследования.

1. Осуществить спектральный анализ акустических характеристик гласноподобных звуков «говорящих» птиц различных видов.

2. Провести внутри- и межвидовое сравнение акустических характеристик гласноподобных звуков, произносимых различными птицам.

3. Сравнить акустические характеристики гласных, произносимых попугаем и обучающим его человеком.

4. Путем модификации спектральных компонентов, выявить их значимость для идентификации фонетической категории звука, имитируемого птицей.

Основные положения, выносимые на защиту.

1. У «говорящих» птиц независимо от способа звукогенерации и четкости произнесения, фонетические категории имитируемых гласных звуков невозможно разделить на основании признака, стабильного для различных категорий гласных звуков человека.

2. Характер огибающей спектра позволяет разделить фонетические категории звуков, имитируемые каждой из исследованных птиц.

3. Выявленные особенности огибающей спектра различных фонетических категорий гласных звуков, имитируемых птицами, характерны также и для гласных звуков человека.

Научная новизна результатов. В работе впервые проведен детальный спектральный анализ различных категорий гласных звуков русского языка «говорящих» птиц разных видов. В результате сравнительного анализа этих звуков с гласными звуками человека были выявлены особенности, характеризующие фонетические категории гласных независимо от способов генерации. А в результате психоакустического эксперимента была показана роль спектральных компонентов, находящихся в различных частотных диапазонах, для фонетической оценки звуков.

Научно-практическая ценность работы. В результате исследования были выявлены акустические признаки фонетических категорий гласных общие для исследованных птиц и человека. Полученные данные могут иметь существенное значение для понимания психофизиологических основ восприятия фонетических категорий гласных как людьми, так и животными. Знание универсальных особенностей фонетических категорий звуков может способствовать развитию систем автоматического распознавания речи.

Апробация диссертационной работы. Материалы работы были представлены на: XII и XIII международных совещаниях по эволюционной физиологии (СПб, 2001, 2006), конференции «Мозг и поведение» (СПб, 2001), молодежной конференции «Человек и его здоровье» (СПб, 2002), международной конференции «Акустика детской речи» (СПб, 2002), XIII и XVI сессиях Российского Акустического Общества (Москва, 2003, 2005), конференциях «Физиология слуха и речи» (СПб, 2003, 2005).

Выполнение исследований было поддержано стипендиями президента Российской Федерации (2005-2006) и Американского акустического общества (2006 - RX0-121-XX-03); персональными грантами для студентов, аспирантов и молодых специалистов за 2002 и 2003 года (№ М02-2.6Д-485 и № М03-2.6Д-227); персональным грантом для аспирантов Федерального агентства по образованию за 2004 год (№ А04-2.12-631); федеральной целевой программой «Государственная поддержка интеграции высшего образования и фундаментальной науки» на 1997-2000 годы; программой Минобразования «Университеты России», №992616, 2000-2001 гг.; грантом Российского Фонда Фундаментальных исследований, № 02-06-80275, 2002-2004 гг.; ведомственной научной программой Минобразования России «Развитие научного потенциала высшей школы» №4727, 2005 г.

1. Обзор литературы

Способность к имитации человеческой речи обнаружена у некоторых видов птиц, относящихся к певчим воробьиным и попугаям. Возникает вопрос, связана ли эта способность с наличием у данных видов неких особенностей, отсутствующих у других птиц.

Певчие воробьиные являются наиболее распространенной и высокоорганизованной группой среди птиц (Ильичев В.Д., 1972). К этому подотряду относится около 4000 современных видов птиц из известных 9000 (Биологический энциклопедический словарь, 1995). По уровню элементарной рассудочной деятельности некоторые виды воробьиных ставятся наравне с низшими приматами (Крушинский JI.B., 1986; Зорина З.А., Полетаева И.И., 2001). Относительный объем мозга и объем конечного мозга у птиц этой группы является наибольшим в своем классе (Iwaniuk A.N. et al., 2005). Высокий уровень элементарной рассудочной деятельности и достаточно крупный мозг также характерен для попугаев. Однако, в отличие от певчих птиц, к этому отряду относится только 316 видов (Биологический энциклопедический словарь, 1995).

Из всех групп животных к данному моменту только у нескольких обнаружена необходимость постнатального обучения видовым сигналам. Сюда входят китообразные, морские львы, летучие мыши, певчие воробьиные, попугаи, колибри (Scharff С., White S.A., 2004) и человек.

Заключение диссертации научная статья по теме "Психофизиология"

1. Гласноподобные звуки, присутствующие в имитационном репертуаре исследованных птиц, независимо от четкости копирования, могут иметь гармоническую и негармоническую структуру.

2. Звуки одной категории, имитируемой птицей, могут иметь различное количество формант. В связи с отсутствием стабильности формантной картины разделение различных категорий гласных звуков с учетом частоты первой и второй форманты невозможно.

3. Распределения зависимости разности амплитуд спектральных компонентов от их частоты для различных категорий гласных звуков у всех исследованных птиц имеют определенные особенности: для идентификации категории «и» существенным является присутствие спектрального максимума на частотах выше 1700 Гц; отличия между категориями «о» и «а» заключаются в присутствии у категории «а» энергетически выраженных спектральных компонентов в диапазоне 1300-1700 Гц, тогда как у категории «о» они отсутствуют.

4. Особенности характера распределения зависимости разности амплитуд спектральных компонентов от их частоты для каждой категории гласного, имитируемого различными птицами, не зависят от их принадлежности к одному или разным видам.

5. Наличие выраженных спектральных компонентов в диапазоне 13001700 Гц у звуков категории «а» по сравнению со звуками категории «о», и спектрального максимума в диапазоне 2000-3000 Гц для категории «и» также характерно для распределений зависимости разности амплитуд спектральных компонентов от их частоты для фонетических категорий звуков человека.

1.4. Заключение

В целом, результаты проведенных исследований свидетельствуют о высокой специализации звукогенерирующего аппарата, звуковоспринимающей системы и нервной организации вокального поведения птиц, способных имитировать человеческую речь, к характеристиками их видовых сигналов. Принципиальных отличий слуха птиц-имитаторов от других птиц не обнаружено. Особенности слуха, характерные для волнистых попугайчиков, отсутствуют у скворца, также способного к имитации речи, и свидетельствуют скорее о специализации слуховой системы волнистых попугайчиков к видовым сигналам. Однако, учитывая, что при восприятии фонем волнистый попугайчик осуществляет их дискриминацию лучше, чем амадина, остается возможность того, что птицы имитаторы лучше различают категории звуков речи. Данные по категориальному восприятию звуков речи птицами очень ограниченны, и полностью отсутствуют исследования этой возможности у крупных птиц: воронов, ара, какаду, серых попугаев и др.

Акустические характеристики звуков речи, имитируемых попугаями, не совпадают с человеческими. Тем не менее, при имитации речевых звуков доступными птицам способами, ключевые признаки различных фонетических категорий должны сохраняться. Известно, что точное копирование формант для некоторых видов птиц оказывается невозможным. В связи с этим можно предположить, что существуют другие признаки, на основании которых осуществляется дискриминация гласных звуков. Особенности слуховой и звукогенерирующей системы птиц позволяют им воспринимать и генерировать звуки в частотном диапазоне второй форманты звуков речи и выше. Поэтому, вероятно, разделение категорий гласных звуков возможно без использования низкочастотной информации (первой форманты) и, следовательно, фонетические категории можно разделить на основании признака, не отраженного в классической формантной теории. Акустические особенности, специфичные для различных категорий гласных звуков, имитируемых птицами, могут оказаться характерными и для иных звуков, также не разделяющихся на основании значений формант (гласноподобные звуки младенцев и гласные вокальной речи). В этом случае возможно, именно эти особенности используются для восприятия категорий звуков различными животными, включая человека.

2. Методика и условия эксперимента

2.1. Условия регистрации речеподобных звуков говорящих птиц

Исследовались имитации речи семи птиц: трех серых попугаев (Psittacus erithacus) (отряд попугаеобразные, сем. попугаи, подсемейство настоящие попугаи), двух волнистых попугайчиков (Melopsittacus undulatus) (отряд попугаеобразные, сем. попугаи, подсемейство настоящие попугаи), скворца-майны (Gracula religiosa) (отряд воробьинообразные, подотряд певчие воробьиные, сем. скворцовые) и обыкновенной канарейки (Serinus canaria) (отряд воробьинообразные, подотряд певчие воробьиные, сем. вьюрковые). С целью сравнения акустических характеристик имитаций слов птицами с речью человека была осуществлена аудиозапись хозяев волнистых попугайчиков.

Сигналы серого попугая Ромы, самца, принадлежащего В.Р. Дольнику регистрировались в домашних условиях при нашем участии. Во время записи птица находилась в своей клетке. Запись проводилась два раза в дневное время с помощью магнитофона SONI WM-D6C (неравномерность частотной характеристики + 3 дБ в диапазоне 40-15000 Гц). В первом случае использовался узконаправленный электретный микрофон DAK UEM-83R закрепленный на расстоянии 1,5 метра от клетки. Запись проводилась полтора часа. Во втором случае использовался динамический микрофон EAG MD-14N закрепленный на штативе на расстоянии 0,3 метра от клетки ниже уровня жердочки, на которой чаще всего находилась птица. Запись проводилась три часа без перерыва.

Запись вокализаций серого попугая Кузи, предположительно самки, принадлежащего А.А. Тихомирову, была проведена на магнитофон SONY TC-D5 Pro II (неравномерность частотной характеристики + 3 дБ в диапазоне 40-17000 Гц) с микрофоном AKG D310 в домашних условиях. Микрофон был закреплен на расстоянии 1,5 метра от клетки на уровне жердочки, на которой сидела птица. Запись проводилась три часа. Птица находилась в комнате одна.

Записи вокализаций серого попугая Киры, предположительно самки, принадлежащего Олегу и Ольге Алексеевым, проводились на протяжении 2002-2004 годов восемь раз. Регистрация звуков осуществлялась от полутора до трех часов. Птица была приобретена птенцом (в возрасте около полугода). Первые имитации проявились через четыре месяца. С этого момента была начата запись ее вокализаций. Регистрация осуществлялась с помощью магнитофона Marantz PMD222 и микрофона Sennheiser Е855. Микрофон находился на расстоянии около метра от попугая.

Запись вокализаций волнистого попугайчика Геши, самца арлекинового окраса, также принадлежащего Олегу и Ольге Алексеевым, осуществлялась в тех же условиях, что и Киры. Микрофон находился на расстоянии 0,3 м от центра клетки. Процедура регистрации осуществлялась пять раз в течение 2002 года в обычных условиях (в присутствии экспериментатора, семьи, остальных животных) по три часа. Только две записи содержали значительное количество имитаций и в дальнейшем анализировались. Речь хозяина Геши записывалась однократно в двух ситуациях: при разговоре с другим человеком и при разговоре с попугаем.

Наиболее обширный объем аудиозаписей был получен в результате регистрации вокализаций зеленого волнистого попугайчика Эрика, самца, принадлежащего автору данного исследования. Запись осуществлялась с момента приобретения птицы птенцом (полтора-два месяца) в 2002 году. Использовались магнитофоны с микрофонами: Marantz PMD222 и Sennheiser Е855, Marantz PMD670 и АТ3031. В дальнейшем фрагменты полученного материала использовались только для сравнения акустических характеристик произнесений с имитациями другого волнистого попугайчика. Полученная запись обычной речи хозяина Эрика и при взаимодействии с попугаем использовалась только для выявления изменения частоты основного тона человека в различных условиях.

Оцифровка полученных аудиозаписей осуществлялась с использованием 16-разрядной звуковой карты Creative Labs AVE 64 и Aardvark DirectMix USB с частотой дискретизации 44100 Гц. В случае использования цифрового магнитофона Marantz PMD670 аудиозапись производилась в формате РСМ, 16 бит, моно, с частотой дискретизации 44100 Гц.

Материал по скворцу-майне Чике и канарейке Пинчи был любезно предоставлен сотрудниками кафедры зоологии позвоночных И.В. Ильинским и Е.А. Кречмаром из фонотеки голосов животных. Записи были проведены А.С. Мальчевским в октябре 1969 года на магнитофон «Репортер-3» с микрофоном Д-55.

2.2. Процедура инструментального анализа записей

Из всего вокального репертуара птиц выделялись имитации слов человеческой речи. Помимо них, в записи присутствовали видовые сигналы и имитации механических звуков. Выделение гласных звуков осуществлялось на слух (на основании однородности звучания выделенного фрагмента), по однородности динамической спектрограммы и амплитудно-динамической формы сигнала (рис. 6, а, б). Длительность выделяемого участка составляла не менее 50 мс. Выделенный из состава слова фрагмент соотносился исследователем с одной из категорий гласных русского языка. Если звук после выделения терял все признаки гласноподобности, в дальнейшем он не анализировался.

Спектральный анализ звуковых сигналов осуществлялся на основе быстрого преобразования Фурье. Взвешивание осуществлялось с помощью окна данных Хемминга с 1024 отсчетами (ширина усредняемой полосы 43 Гц) (Рабинер Л.Р, Шафер Р.В, 1981).

В связи с тем, что спектры гласноподобных звуков, в большинстве случаев, не являлись гармоническими, то определялась частота и амплитуда всех спектральных компонентов, необходимых для описания контура огибающей спектра, начиная с первой составляющей, превышающей уровень шума, и до момента исчезновения выраженных компонентов. Ниже 2 кГц осуществлялось определение частот и амплитуд всех спектральных компонентов, необходимых для описания огибающей спектральных максимумов, выше - регистрировались значения только спектральных максимумов. В спектре каждого звука выделялось до трех формантных составляющих (спектральных максимумов) (рис. 6, в). Хотя однозначные данные о соответствии частоты спектральных максимумов вокализаций птиц резонансным характеристикам их вокального тракта отсутствуют, для упрощения обозначений, под формантой в дальнейшем будет подразумеваться частота энергетически выраженного спектрального компонента, образующего максимум на огибающей спектра. Частота основного тона определялась в случае звуков с гармонической структурой. Гармоническим считался звук на амплитудно-динамической форме которого можно было выявить периоды основного тона; в случае если суммарный спектр состоял из ряда кратных друг другу спектральных компонентов (гармоник). За частоту основного тона принималась частота первой гармоники суммарного спектра, если это значение совпадало (+43 Гц) с частотой периодов основного тона амплитудно-динамической формы звука. Спектр звука не удовлетворяющий вышеперечисленным условиям считался не гармоническим.

Рис. 6. Акустические характеристики звука «а» из слова «хароший», произнесенного волнистым попугаем Гешей а). Динамическая спектрограмма (512 отсчетов) произнесения слова «хароший». Стрелкой выделен участок, соответствующий гласному «а». По оси абсцисс - время, мс; по оси ординат - частота, Гц. б) Амплитудно-динамическая форма гласного «а». По оси абсцисс - время, мс; по оси ординат амплитуда, дБ. в). Суммарный спектр (1024 отсчета) гласного «а». По оси абсцисс - частота, Гц; по оси ординат - амплитуда, дБ. Вертикальными стрелками обозначены спектральные компоненты, данные о которых заносились в базу, цифрами - спектральные компоненты, принятые за форманты.

В случае негармонической структуры спектра и отсутствии периодов основного тона на амплитудно-динамической форме звука, на основании данных P. Banta Lavenex (1999), рассматривалась возможность образования звука более чем одним источником. Результатом этого могла быть негармоническая структура спектра звука, и отсутствие периодов основного тона на амплитудно-динамической форме звука. В случае если на амплитудно-динамической структуре анализируемого звука можно было выделить не менее десяти импульсов со сходной длительностью, звук считался квазипериодическим. Определялась его несущая и модулирующая частоты (рис. 7). При невозможности выделения отдельных импульсов звук считался не имеющим периодической структуры.

Рис. 7. Амплитудно-динамическая форма гласноподобного звука «а», произнесенного попугаем Ромой

Длинные стрелки - периоды модулирующей частоты, короткие стрелки - периоды несущей частоты.

При анализе гласных звуков человека, выделенных из обычной речи и при взаимодействии с птицей, определялась частота и амплитуда гармоник, частотные значения формант и основного тона.

2.3. Обработка данных

Полученные значения частоты и амплитуды всех спектральных компонентов заносились в базу. Из амплитуды каждого спектрального компонента вычиталась амплитуда первого спектрального компонента, превысившего уровень шума, и полученная разность переводилась в абсолютную величину. Полученные значения амплитуды для всех спектральных компонентов звуков, отнесенных к единой фонетической категории, распределялись по частотным диапазонам, соответствующим критическим полосам слуха человека (Цвикер Э., Фельдкеллер Р., 1965). В каждой критической полосе определялась их медиана. Значение медианы переводилось в децибелы, и вводилась поправка на аудиограмму для каждой критической полосы. После этого строились распределения зависимости медиан разности амплитуд от частоты спектральных компонентов. Достоверность различий распределений в каждой критической полосе определялась по критерию Колмогорова-Смирнова.

2.4. Аудиторский анализ

Аудиторскому анализу были подвергнуты звуки попугаев Кузи и Геши, отнесенные исследователем к различным фонетическим категориям. Серия звуков, предназначенная для прослушивания, состояла из пятидесяти гласноподобных, каждый из которых повторялся по три раза с интервалом 400 мс, различные звуки были разделены интервалом в полторы секунды. Серии предъявлялись группам студентов, ранее в подобных экспериментах не участвовавших. При демонстрации гласноподобных звуков Геши предварительно проигрывался небольшой участок аудиозаписи «говорения» попугая. Перед аудиторами ставилась задача обозначить, какой гласный звук (любая категория гласных русского языка) они слышат, или поставить прочерк, если предъявляемый звук нельзя отнести ни к одной категории. Было получено двенадцать вариантов ответа (а, о, у, и, ы, е, ю, я, э, ё, звук состоит из двух разных гласных, не гласный звук). Всего было предъявлено 8 серий звуков попугая Кузи (в прослушивании участвовало от 27 до 92 человек), и 10 серий звуков волнистого попугайчика Геши (в прослушивании участвовало от 18 до 64 человек). Достоверность идентификации звука определялась по биномиальному критерию.

2.5. Процедура модификации спектральных компонентов гласноподобных звуков попугаев Кузи и Геши

С целью выявления значимости частоты и амплитуды различных спектральных компонентов для отнесения звука к той или иной фонетической категории, была проведена модификация серии звуков. С помощью фильтра преобразования Фурье (FFT фильтр, программа Cool Edit Pro) производились изменения амплитуды спектральных составляющих. Модификация проводилась тремя способами.

В первом случае проводилось понижение амплитуды каждого из спектральных максимумов звука таким образом, чтобы этот максимум не мог бы быть выделен (рис. 8, а-г). Были модифицированы один звук «о» и три звука «а» попугая Геши, три звука «а», два звука «о» и три звука «у» попугая Кузи. Во втором случае модифицировались звуки спектральные максимумы которых представляли собой энергетически выраженный диапазон частот различной ширины (до 1 ООО Гц) и не могли быть описаны единственным значением частоты и амплитуды. У этих звуков проводилось изменение ширины этого частотного диапазона путем подавления амплитуды спектральных составляющих в его определенной части (рис. 8, д-е). У трех звуков «а» попугая Кузи были подавлены спектральные составляющие в диапазоне 1480-1720 Гц (12 критическая полоса), у двух звуков «а» попугая Геши были подавлены спектральные составляющие в диапазоне 1260-1990 Гц (11-13 критическая полоса).

У четырех звуков было проведено транспонирование частот с их повышением и понижением (рис. 8, ж-з). Транспонирование в сторону понижения частоты осуществлялось шагами с отношением 0.79 всех частот предыдущего звука по отношению к частотам последующего. То есть если у исходного звука значения частот формант составляли 600 Гц, 1270 Гц, 2150 Гц, то в результате первого шага транспонирования в сторону понижения, частоты формант составили 474 Гц, 1003 Гц, 1698 Гц, в результате второго шага - 374 Гц, 792 Гц и 1341 Гц и т.д. Повышение частот осуществлялось с соблюдением отношения 1.33. Частоты формант в результате первого шага в сторону повышения частоты составили 798 Гц, 1689 Гц, 2859 Гц. Для каждого звука было проведено несколько шагов транспонирования частоты в сторону ее понижения и повышения.

Для модификации акустических характеристик были отобраны звуки серого попугая Кузи и волнистого попугайчика Геши, получившие высокий уровень идентификации в общем аудиторском анализе (раздел 2.4). Модифицированные звуки идентифицировались группой из пяти-семи опытных аудиторов с помощью наушников Sennheiser. Аудиторы могли слушать все звуки в серии любое количество раз и в любом порядке. Перед ними ставилась задача обозначить изменил ли модифицированный звук категорию по сравнению с категорией не модифицированного звука и каким образом. При идентификации транспонированных звуков предлагалось ограничить ответы четырьмя категориями звуков: «а», «о», «у», «и». В дальнейшем анализировались серии в которых оценка категории исходного звука опытными аудиторами совпала с его оценкой в общем аудиторском анализе. а) Исходны и звук в VwV 71 vV\ г.] 00 - -11 » "1* В ГЦ Oi> д) Исходный звук - 0 л

1 I И 1000 10 т Гц б)

С Н J V j

V U ЧЛМ\. ч г » Им iowc Гц е)

1 it 00 1» Wi К в) f

-

Г * ■ 101 » ucw Гц 0 о

71 -101 а

1 Ж 10 и 10 W Гц i) iSjft

-- Ь У Ч VMLAMIW

1 ■ 10 ооо Т*

Рис. 8. Модификация частоты и амплитуды спектральных компонентов гласноподобных звуков говорящих птиц

По оси абсцисс - частота, Гц, по оси ординат, амплитуда, дБ. а-г — подавление амплитуда спекгральных максимумов; д-е - подавление амплитуда спектральных компонентов в определенном частотном диапазоне. Красные овалы демонстрируют область в которой была проведена модификация, ж-з - транспонирование частот. Спектр черным цветом - спектр исходного звука. Спектр красным цветом - спектр транспонированного на один шаг звука: ж) с понижением частоты, з) с повышением частоты.

3. Результаты

3.1. Характеристика имитационного репертуара различных птиц

Имеющиеся данные о различных способах звукогенерации у птиц разных отрядов: попугае- и воробьинообразных, позволяли ожидать отличий в акустической структуре их имитационных звуков. В связи с этим были проанализированы аудиозаписи имитаций речи птицами различных видов: тремя серыми попугаями Ромой, Кузей и Кирой, волнистым попугайчиком Гешей, скворцом-майной Чикой и канарейкой Пинчи. Птицы относились к двум различным отрядам: попугаеобразным (попугаи) и воробьинообразным (майна и канарейка). Количество выделенных звуков представлено в таблице 1.

Список литературы диссертации автор научной работы: кандидат биологических наук , Уплисова, Ксения Олеговна, Санкт-Петербург

1. Андреева Н. Г. Становление речи на ранних этапах онтогенеза // Нервная система. 2001. - №35. - С. 59-84.

2. Андреева Н.Г., Куликов Г.А. Характеристики вокальных гласных при разной частоте основного тона // Рос. Физиол. Журн. им. И.М. Сеченова. 2003. - Т. 89, №6. - С. 715-724.

3. Альтман Я.А. Слуховая система // Физиология сенсорных систем (под ред. Я.А. Альтмана). СПб.: Паритет, 2003. С. 135-183.

4. Биологический энциклопедический словарь М.: Изд-во «Большая советская энциклопедия», 1995, 864 с.

5. Бехтерева Н.П. О мозге человека. СПб: Нотабене, 1994. 244 с.

6. Бондарко JI.B. Фонетика современного русского языка (Учебное пособие). СПб.: СПбГУ, 1998. 276 с.

7. Брэм А.Э. Жизнь животных: в 3 т. Т. 2: Птицы. М.: ТЕРРА, 1992. -352 с.

8. Вартанян И.А. Нейрофизиологические основы речевой деятельности // Механизмы деятельности мозга человека. Нейрофизиология человека. Л., 1988,-С. 608-666.

9. Вартанян И.А. Сравнительная физиология слуховой системы // Слуховая система (под ред. Я.А. Альтмана). JL: Наука, 1990. С. 513574.

10. Вартанян И.А., Галунов В.И. Восприятие речи. Вопросы функциональной асимметрии мозга. М.: Наука, 1988. 135 с.

11. Вартанян И.А., Черниговская Т.В. Роль несущей частоты в восприятии сигналов с различной ритмической структурой. Проблема асимметрии // Сенсорные системы. 1993. - Т. 7, №1. - С. 36-39.

12. Варшавский JI.A., Литвак И.М. Исследование формантного состава и некоторых других физических характеристик звуков русской речи // Проблемы физиологической акустики. М.-Л., 1955. - Т. 3. - С. 5-17.

13. Габарук В.И. Особенности признакового восприятия звуков речи: Диссертация на соискание ученой степени кандидата биологических наук.-СПб, 1984.- 192 с.

14. Галунов В.И., Габарук В.И. Акустическая теория речеобразования и система фонетических признаков // 100 лет экспериментальной фонетике в России. Материалы международной конференции. СПб,2001.-С. 58-63.

15. Деркач М.Ф., Гумецкий Р.Я., Гура Б.М., Чабан М.Е. Динамические спектры речевых сигналов. Львов: Высшая школа, 1983. - 166 с.

16. Зорина З.А., Полетаева И.И. Элементарное мышление животных. -М.: Аспект Пресс, 2001. 320 с.

17. Ильичев В.Д. Биоакустика птиц. М.: МГУ, 1972. - 286 с.

18. Ильичев В. Д., Силаева О. Л. Сопоставление видовых сигналов птиц и речевых сигналов человека // Известия АН. Серия Биологическая.2002. -№1. С. 67-73.

19. Ильичев В.Д., Силаева О.Л., Вараксин А.Н. Говорящие птицы и речь человека: фонемный анализ // Современные речевые технологии. IX сессия.-М., 1999.-С. 88-91.

20. Ильичев В.Д., Никольский Н.Д. Голоса животных. М.:Просвещение, 1977.-95 с.

21. Кодзасов С.В., Кривнова О.Ф. Общая фонетика. М.: Рос. гос. гуманит. ун-т, 2001. - 592 с.

22. Кречмар Е.А., Ильинский И.В., Макаров А.К., Шибков А.А. К проблеме создания единой системы классификации акустических сигналов у птиц // Русский орнитологический журнал. Экспресс выпуск. 2001. -№168. - С. 1030-1036.

23. Крушинский Л.В. Биологические основы рассудочной деятельности. -М.: МГУ, 1986.-270 с.

24. Куликов Г.А, Андреева Н.Г, Павликова М.И, Самокищук А.П. Характеристики гласноподобных звуков детей первого полугодия жизни // Доклады Академии Наук. 1999. - Т. 368, № 6. - С. 843-845.

25. Куликов Г.А, Андреева Н.Г, Самокищук А.П. Сравнительный анализ гласных и гласноподобных звуков при разных условиях их генерации // Сенсорные Системы. 2002. - Т. 16, №3. - С. 230-237.

26. Лиска Д, Вартанян И.А, Черниговская Т.В. Изучение восприятия внутри- и межвидовой знаковой информации (обзор и возможные направления сравнительно-физиологических исследований) // Сенсорные Системы. 1994. - Т. 8, №2. - С. 106-110.

27. Лоренц К.З. Кольцо царя Соломона. М.: Знание, 1970. 224 с.

28. Мальчевский А.С, Пукинский Ю.Б. Роль звуковой индукции в голосовом поведении птиц // Звуковая коммуникация, эхолокация и слух.-Л, 1980.-С. 5-22.

29. Мушников В.Н, Чистович Л.А. О слуховом описании гласного // Анализ речевых сигналов человеком. Л, 1971. - С. 5-10.

30. Мясников Л.Л, Мясникова Е.Н. Автоматическое распознавание звуковых образов. Л.: Энергия, 1970. - 184 с.

31. Рабинер Л.Р, Шафер Р.В. Цифровая обработка речевых сигналов. М.: Радио и связь, 1981.-495 с.

32. Силаева О.Л. Биоакустические типы речевых имитаций птиц // Известия академии наук. Серия биологическая. 1995. - №6. - С. 729738.

33. Силаева О.Л. Сопоставительный анализ голоса птицы-имитатора и человека-донора // Доклады академии наук. 1998. - Т. 360, №1. - С. 138-140.

34. Тихонов А.В. Акустическая сигнализация и экология поведения птиц. -М.: МГУ, 1986.-236 с.

35. Фант Г. Акустическая теория речеобразования. М.: Наука, 1964. -284 с.

36. Фант Г. Анализ и синтез речи. Новосибирск: Наука, 1970. - 166 с.

37. Фланаган Дж. Анализ, синтез и восприятие речи. М.: Связь, 1968. -396 с.

38. Цвикер Э, Фельдкеллер Р. Ухо как приемник информации: Пер. с нем. -М.: Связь, 1971. 255 с.

39. Черниговская Т.В. Зависимость восприятия низкочастотной амплитудной модуляции от возраста и тренировки у человека // Журнал эволюционной биохимии и физиологии. 1976. - Т. 12, №4. -С.387-389.

40. Черниговская Т.В. Мозг и язык: полтора века исследований // Теоретические проблемы языкознания. СПб: Фил. фак. СПбГУ, 2004.-С. 16-34.

41. Черниговская Т.В, Лях Н.Ю, Токарева Т.И. Латерализация восприятия слов в зависимости от лингвистических факторов // Физиология человека. 1996. - Т. 22, №4 - С. 12-17.

42. Чистович Л.А. Речеобразование и восприятие речи // Физиология сенсорных систем под ред. А.С. Батуева. Л.: Медицина, 1976. С. 199216.

43. Чистович Л.А, Венцов А.В, Люблинская В.В, Столяров Э.И, Чистович И.А. Слуховые уровни восприятия речи. Функциональное моделирование // Акустика речи и слуха. Л, 1986. - С. 97-126.

44. Чистович Л.А, Венцов А.В, Грангстрем М.П. Физиология речи. Восприятие речи человеком. Л.: Наука, 1976. 386 с.

45. Чистович Л.А, Шупляков В.С // Анализ речевых сигналов человеком. -Л, 1966.-С. 19-28.

46. Ball G.F, Hulse S.H. // American Psychologist. 1998. - Vol. 53. - № 1. -P. 37-58.

47. Banta Lavenex P. Vocal production mechanisms in the budgerigar (.Melopsittacus undulatus): the presence and implications of amplitude modulation // Journal of the Acoustical Society of America. 1999. - Vol. 106. -№ l.-P. 491-505.

48. Beckers G.J.L., Nelson B.S., Suthers R.A. Vocal-tract filtering by lingual articulation in a parrot // Current Biology. 2004. - Vol. 14. - № 17. - P. 1592-1597.

49. Braaten R.F., Hulse S.H. A Songbird, the European Starling (Sturnus vulgaris), shows perceptual constancy for acoustic spectral structure // Journal of Comparative Psychology. 1991. - Vol. 105. - № 3. - P. 222231.

50. Brackenbury J.H. Aeroacoustics of the vocal organ of birds // Journal of Theoretical Biology. 1979.-Vol. 81.-P. 341-349.

51. Brauth S.E., Liang W., Roberts T.F. Projections of the Oval Nucleus of the Hyperstriatum Ventrale in the budgerigar: relationships with the auditory system // Journal of Comparative Neurology. 2001. - Vol. 132. - P. 481485.

52. Brittan-Powell E., Dooling R.J., Farabaugh S.M. Vocal development in budgerigars contact calls // Journal Of Comparative Physiology. 1997a. -Vol. lll.-№3.-P. 226-241.

53. Brittan-Powell E., Dooling R.J., Larsen O.N., Heaton J.T. Mechanisms of vocal production in budgerigars (Melopsittacus undulatus) II Journal of the Acoustical Society of America. 1997b.-Vol. 101. -№ l.-P. 578-589.

54. Brown S.D., Dooling R.J., O'Grady K. Perceptual organization of acoustic stimuli by budgerigars {Melopsittacus undulatus): III. Contact calls // Journal of Comparative Psychology. 1988. - Vol. 102. - № 3. - P. 236247.

55. Burdick C.K., Miller J.D. Speech perception by the chinchilla: Discrimination of sustained /а/ and N II Journal of the Acoustical Societyof America. 1975. - V. 58. - P. 415-427.

56. Chistovich L.A, Lublinskaya V.V. The center of gravity in vowel spectra and critical distance between the formants: psychoacoustical study of the perception of vowel-like stimuli // Hearing Research. 1979. - V. 1. - P. 185-195.

57. Chernigovskaya T. Cerebral lateralization for cognitive and linguistic abilities: Neuropsychological and cultural aspects // Studies in Language Origins. Amsterdam, Philadelphia, 1994. - P. 56-76.

58. Clack T.D. Effect of signal duration on the auditory sensitivity of humans and monkeys (Macaca mulatto) II Journal of the Acoustical Society of America, 1966. V. 40. - P. 1140-1146.

59. Cynx J. Auditory frequency generalization and a failure to find octave generalization in a songbird, the European Starling (Sturnus vulgaris) // Journal of Comparative Psychology. 1993. - Vol. 107. - № 2. - P. 140146.

60. Cynx J. Auditory frequency generalization and a failure to find octave generalization in a Songbird, the European Starling (Sturnus vulgaris) // Journal of Comparative Psychology. 1993a. - Vol. 107. - № 2. - P. 140146.

61. Cynx J. Conspecific song perception in Zebra Finches (Taeniopygia guttata) И Journal of Comparative Psychology. 1993b. - Vol. 107. - № 4. -P. 395-402.

62. Cynx J. Experimental determination of a unit of song production in the Zebra Finch (Taeniopygia guttata) // Journal of Comparative Psychology. -1990.-Vol. 104. -№ 1.-P.3-10.

63. Cynx J, Williams H, Nottebohm F. Hemispheric differences in avian song discrimination // Proceedings of the National Academy of Sciences. -1992. Vol. 89. -№ 4. - P. 1372-1375.

64. Cynx J., Williams H., Nottebohm F. Timbre discrimination in Zebra Finch (Taeniopygia guttata)'. Song syllables // Journal of Comparative Psychology. 1990. - Vol. 104. - № 4. - P. 303-308.

65. Dent M.L., Brittan-Powell E., Dooling R.J., Pierce A.S. Perception of synthetic /ba/-/wa/ speech continuum by budgerigars (Melopsittacus undulatus) II Journal of the Acoustical Society of America. 1997a. - Vol. 102. -№ 3. - P. 1891-1897.

66. Dent M.L., Dooling R.J., Pierce A.S. Frequency discrimination in budgerigars (Melopsittacus undulatus): Effects of tone duration and tonal context // Journal of the Acoustical Society of America. 2000. - Vol. 107. -№ 5. - P. 2657-2664.

67. Dent M.L., Larsen O.N., Dooling R.J. Free-Field binaural unmasking in budgerigars (Melopsittacus undulatus) II Behavioral Neuroscience. -1997b. Vol. 111. - № 3. - P. 590-598.

68. Dewson J. H. Speech sound discrimination by cats // Science. 1964. - V. 144.-P. 555-556.

69. Dewson J.H., Pribram K.H., Lynch J.C. Effects of ablations and temporal cortex upon speech sound discrimination in the monkey // Exp. Neurol., 1969.-V. 24.-P. 579-591.

70. Dooling R.J. Perception of vocal signals by budgerigars (Melopsittacus undulatus) // Experimental Biology. 1986. - V. 45. - P. 195-218.

71. Dooling R.J. Hearing in birds // Evolutionary Biology of Hearing (edited by D.B. Webster, R.R. Fay, and A.N. Popper). New York: Springer-Verlag., 1992.

72. Dooling R.J. Perception of speech sounds by birds // Advances in Biosciences: Auditory Physiology and Perception (edited by Y. Cazals, L. Demany, and K. Horner). London: Pergamon, 1992.

73. Dooling R.J. Perception of vocal signals by budgerigars (Melopsittacus undulatus) II Experimental Biology. 1986. - Vol. 45. - P. 195-218.

74. Dooling R.J., Brown S.D. Speech perception by budgerigars {Melopsittacus undulatus): Spoken vowels // Percept. Psychophys., 1990. - V. 47. - P. 568-574.

75. Dooling R.J., Brown S.D., Klump G.M., Okanoya K. Auditory perception of conspecific and heterospecific vocalizations in birds: evidence for special processes // Journal of Comparative Psychology. 1992. - Vol. 106. -№ 1. - P. 20-28.

76. Dooling R.J., Brown S.D., Park T.J., Okanoya K. Perceptual organization of acoustic stimuli by budgerigars: I. Pure tones // Journal Of Comparative Physiology.- 1987a.-Vol. 101.-№2.-P. 139-149.

77. Dooling R.J., Dent M.L., Leek M.R., Gleich 0. Masking by harmonic complexes in birds: behavioral thresholds and cochlear responses // Hearing Research.-2001.-Vol. 152.-№ 1-2.-P. 159-172.

78. Dooling R.J., Okanoya K., Brown S.D. Speech perception by budgerigars (Melopsittacus undulatus): The voiced-voiceless distinction // Perception and Psychophysics. 1989. - Vol. 46. - № 1. - P. 65-71.

79. Dooling R.J., Park T.J., Brown S.D., Okanoya K. Perceptual organization of acoustic stimuli by budgerigars (Melopsttacus undulatus): II. Vocal signals // Journal of Comparative Psychology. 1987b. - Vol. 101. - № 4. -P. 367-381.

80. Dooling R.J., Searcy M.H. Amplitude modulation thresholds for the Parakeet (Melopsittacus undulatus) // Journal of Comparative Physiology. -1981.-Vol. 143.-P. 383-388.

81. Dooling R.J, Searcy M.H. Temporal integration of acoustic signals by the budgerigar // Journal of the Acoustical Society of America. 1985. - Vol. 77.-№ 5.-P. 1917-1920.

82. Doupe A.J, Kuhl P.K. Birdsong and human speech: common themes and mechanisms // Annual Review of Neuroscience. 1999. - Vol. 22. - P. 567-631.

83. Ehret G. Masked auditory thresholds, critical ratios, and scales of the basilar membrane of the housemouse (Mus musculus) II J. Сотр. Physiol.- 1975.-V. 103.-P. 329-341.

84. Farabaugh S.M, Linzenbold A, Dooling R.J. Vocal plasticity in budgerigars (Melopsittacus undulatus): evidence for social factors in the learning of contact calls // Journal of Comparative Psychology. 1994. -Vol. 108.-№ 1.-P. 81-92.

85. Fee M.S., Shraiman B, Pesaran B, Mitra P.P. The role of nonlinear dynamics of the syrinx in the vocalizations of a songbird // Nature. 1998.- Vol. 395. № 6697. - P. 67-71.

86. Fletcher H. Auditory pattern // Rev. Mod. Physics. 1940. - V. 12. - №1. -P. 47-65.

87. Fletcher N.H, Tarnopolsky A. Acoustics of the avian vocal tract // Journal of the Acoustical Society of America. 1999. - Vol. 105. - № 1. - P. 3549.

88. Gaban-Lima R, Hofling E. Comparative anatomy of the syrinx in the tribe Arini (Aves: Psittacidae) // Braz. J. Morphol. Sci. 2006. - V. 23. - № 3-4. -P. 501-512.

89. Gaunt A. S. A hypothesis concerning the relationship of syringeal structure to vocal abilities // Auk. 1983. - V. 100. - P. 853-862.

90. Gaunt A.S, Gaunt S.L.L. Electromyographic studies of the syrinx in parrots {Aves, Psittacidae) // Zoomorphology. 1985. - Vol. 105. - № 1. -P. 1-11.

91. Goldstein M.H, King A.P, West M.J. Social interaction shapes babbling: Testing parallels between birdsong and speech // Proceedings of the National Academy of Sciences. 2003. - Vol. 100. - № 13. - P. 80308035.

92. Goller F., Larsen O.N. A new mechanism of sound generation in songbirds // Proceedings of the National Academy of Sciences. 1997. - Vol. 94. -P. 14787-14791.

93. Goller F, Larsen O.N. New perspectives on mechanisms of sound generation in songbirds // Journal of Comparative Physiology A: Neuroethology, Sensory, Neural, and Behavioral Physiology. 2002. -Vol. 188.-№ 11-12.-P. 841-850.

94. Goller F, Suthers R.A. Implications for lateralization of bird song from unilateral gating of bilateral motor patterns // Nature. 1995. - Vol. 373. -№6509.-P. 63-66.

95. Gourevitch G. Auditory masking in the rat // Journal of the Acoustical Society of America. 1965. - V. 37. - P. 439-443.

96. Gramza A.F. Vocal mimicry in captive Budgerigars (Melopsittacus undulatus) IIZ. Tierpsychol. 1970. - Vol. 27. - № 8. - P. 971.

97. Hauser M.D., Chomsky N, Fitch W.T. The faculty of language: what is it, who has it, and how did it evolve? // Science. 2002. - V. 298. - P. 15691579.

98. Hawkins I.E. Jr., Stevens S.S. The masking of pure tones and of speech by white noise // Journal of the Acoustical Society of America. 1950. - V. 22.-P. 6-13.

99. Heaton J.T, Farabaugh S.M, Brauth S.E. Effect of syringeal denervation in the budgerigar (Melopsittacus undulatus): the role of the syrinx in call production // Neurobiology of Learning and Memory. 1995. - Vol. 64. -№ 1. - P. 68-82.

100. Henderson D. Temporal summation of acoustic signals by the chinchilla // Journal of the Acoustical Society of America. 1969. - V. 46. - P. 474475.

101. Hienz R.D, Sachs M.B, Sinnott J.M. Discrimination of steady-state vowels by blackbirds and pigeons // Journal of the Acoustical Society of America. 1981. - Vol. 70. - № 3. - P. 699-706.

102. Hoese W.J, Podos J, Boetticher N.C, Nowicki S. Vocal tract function in birdsong production: Experimental manipulation of beak movements // Journal of Experimental Biology. 2000. - Vol. 203. - № 12. - P. 18451855.

103. Ilychev V.D, Silaeva O.L. Comparison of species signals of animals and human speech signals // Russian Acoustical Society. XI Session. -Moscow, 2001.-P. 19-23.

104. Ito M, Tsuchida J, Yano M. On the effectiveness of whole spectral shape for vowel perception // Journal of the Acoustical Society of America. -2001.-V. 110.-№2.-P. 1141-1149.

105. Iwaniuk A.N, Dean K.M, Nelson J.E. Interspecific allometry of the brain and brain regions in parrots (psittaciformes): comparisons with other birds and primates // Brain, Behavior and Evolution. 2005. - Vol. 65. - № 1. -P. 40-59.

106. Jarvis E.D. Learned birdsong and the neurobiology of human language // Annals of the New York Academy of Sciences. 2004. - Vol. 1016. - P. 749-777.

107. Johnson C.S. Masked tonal thresholds in the bottle-nosed porpoise // Journal of the Acoustical Society of America. 1968. - V. 44. - P. 965967.

108. Johnson C.S. Relation between absolute thresholds and duration-of-tone pulses in the bottlenosed porpoise // Journal of the Acoustical Society of America, 1968. V. 43. - P. 757-763.

109. Jones A.E., ten Cate C., Slater P.J.B. Early experience and plasticity of song in adult male Zebra Finches (Taeniopygia guttata) // Journal of Comparative Psychology. 1996. - Vol. 110. - № 4. - P. 354-369.

110. Klatt D.H., Stefanski R.A. How does a mynah bird imitate human speech? // Journal of the Acoustical Society of America. 1974. - Vol. 55. - № 4. -P. 822-832.

111. Kluender K.R., Diehl R.L., Killeen P.R. Japanese quail can learn phonetic categories//Science. 1987.-V. 237.-P. 1195-1197.

112. Klump G.M., Maier E.H. Temporal summation in the European Starling (Sturnus vulgaris) // Journal of Comparative Psychology. 1990. - Vol. 104.-№ l.-P. 94-100.

113. Kuhl P. K., Miller J. D. Speech perception by the chinchilla: Identification functions for synthetic VOT stimuli // Journal of the Acoustical Society of America. 1978. - V. 63. - P. 905-917.

114. Kuhl P.K. Discrimination of speech by nonhuman animals: Basic auditory sensitivities conducive to the perception of speech-sound categories // Journal of the Acoustical Society of America. 1981. - V. 70. - № 2. - P. 340-349.

115. Langemann U., Klump G.M., Dooling RJ. Critical bands and critical-ratio bandwidth in the European Starling // Hearing Research. 1995. - Vol. 84. -№ 1-2.-P. 167-176.

116. Larsen O.N., Goller F. Direct observation of syringeal muscle function in songbirds and a parrot // Journal of Experimental Biology. 2002. - Vol. 205.-№ l.-P. 25-35.

117. Leek M.R., Dent M.L., Dooling R.J. Masking by harmonic complexes in budgerigars (Melopsittacus undulatus) // Journal of the Acoustical Society of America.- 2000. -Vol. 107. -№3.- P. 1737-1744.

118. Lohr В., Dooling R.J. Detection of changes in timbre and harmonicity in complex sounds by Zebra Finches (Taeniopygia guttata) and Budgerigars (Melopsittacus undulatus) II Journal of Comparative Psychology. 1998. -Vol. 112.-№ l.-P. 36-47.

119. Manabe K., Dooling R.J. Control of vocal production in budgerigars (Melopsittacus undulatus): selective reinforcement, call differentiation, and stimulus control // Behavioral Processes. 1997. - Vol. 41. - № 2. - P. 117-132.

120. Manabe K., Staddon J.E.R., Cleaveland J.M. Control of vocal repertoire by reward in budgerigars (Melopsittacus undulatus) II Journal of Comparative Psychology. 1997. - Vol. 111. - № 1. - P. 50-62.

121. Manley G.A., Schwabedissen G., Gleich O. Morfology of the basilar papilla of the Budgerigar (Melopsittacus undulates) II Journal of Morfology. 1993.-Vol. 218.-P. 153-165.

122. Marler P. Birdsong and speech development: could there be parallels? // American Scientist. 1970. - Vol. 58. - № 6. - P. 669-673.

123. Marler P., Peters S. Birdsong and speech: Evidence for special processing // Perspectives on the study of speech (edited by P. Eimas and J. Miller, Hillsdale). -N.Y.: Erlbaum, 1981.-P. 75-112.

124. Marler P., Peters S. Subsong and plastic song: Their role in the vocallearning process // Acoustic Communication in Birds (edited by D. Kroodsma and E. Miller). New York: Academic, 1982. - Vol. 2. - P. 2550.

125. Maurer D, Landis Th. FO-dependence, number alteration, and non-systematic behavior of the formants in german vowels // Intern. J. Neurocience. 1995. - V. 83. - P. 25-44.

126. Nearey T. Phonetic features for vowels. Bloomington;: Indiana University Linguistics Club, 1979.

127. Nelson B.S, Deckers G.J.L, Suthers R.A. Vocal tract filtering and sound radiation in a songbird // Journal of Experimental Biology. 2005. - Vol. 208.-№2.-P. 297-308.

128. Nicolas G, Fraigneau C, Aubin T. Variation in the behavioral responses of Budgerigars (Melopsittcicus undulates) to an alarm call in relation to sex and season // Anais da Academia Brasileira de Ciencias. 2004. - Vol. 76. -№2.-P. 359-364.

129. Nottebohm F. Ontogeny of bird song // Science. 1970. - Vol. 167. - P. 950-956.

130. Nottebohm F. Phonation in the Orange-winged Amazon parrot (Amazona amazonica) И Journal of Comparative Physiology. 1976. - Vol. 108. - P. 157-170.

131. Nottebohm F, Nottebohm M.E. Left hypoglossal dominance in the control of canary and white-crowned sparrow song // J. of Сотр. Physiol. 1976. -V. 108.-P. 170-192.

132. Nowicki S. Vocal tract resonances in oscine bird sound production: evidence from birdsongs in a helium atmosphere // Nature. 1987. - Vol. 325.-№6099.-P. 53-55.

133. Nowicki S, Capranica R.R. Bilateral syringeal interaction in vocal production of an oscine bird sound // Science. 1986. - Vol. 231. - № 4743.-P. 1297-1299.

134. Okanoya К, Dooling R.J. Hearing in Passerine and Psittacine birds: a comparative study of absolute and masked auditory thresholds // Journal of Comparative Psychology.- 1987,-Vol. 101. -№ 1. -P. 7-15.

135. Okanoya K, Dooling R.J. Perception of distance calls by budgerigars (Melopsittacus undulatus) and Zebra Finches (Poephila guttata): Assessing species-specific advantages // Journal of Comparative Psychology. 1991. -Vol. 105.-№ l.-p. 60-72.

136. Page S.C, Hulse S.H, Cynx J. Relative pitch perception in the European Starling (Sturnus vulgaris): Further evidence for an elusive phenomenon // Journal of Experimental Psychology: Animal Behavior Processes. 1989. -Vol. 15.-№2.-P. 137-146.

137. Patterson D.K, Pepperberg I.M. A comparative study of human and parrot phonation: Acoustic and articulatory correlates of vowels // Journal of the Acoustical Society of America. 1994. - Vol. 96. - № 2. - P. 634-648.

138. Pepperberg I.M. Cognitive and communicative abilities of Grey Parrots // Current Directions in Psychological Science. 2002. - Vol. 11. - № 3. - P. 83-87.

139. Pepperberg I.M, Brezinsky M.V. Acquisition of a relative class concept by an African Gray Parrot (Psittacus erithacus): Discriminations based on relative size // Journal of Comparative Psychology. 1991. - Vol. 105. — №3.-P. 286-294.

140. Pepperberg I.M, Shive H.R. Simultaneous development of vocal and physical object combinations by a Grey Parrot (Psittacus erithacus): Bottle caps, lids, and labels // Journal of Comparative Psychology. 2001. - Vol. 115,-№4.-P. 376-384.

141. Peterson G.E, Barney H.L. Control methods used in a study of the vowels // Journal of the Acoustical Society of America. 1952. - V. 24. - P. 175184.

142. Pulvermueller F. Words in the brain's language // Behav. and Brain Sciences. 1999. - V. 22. - P. 253.

143. Reiner A., Perkel D.J., Bruce L.L., Butler A.B. Revised nomenclature for avian Telencephalon and some related brainstem nuclei // Journal of Comparative Neurology. 2004. - Vol. 473. - P. 377-414.

144. Saunders J.C., Denny R.M., Bock G.R. Critical bands in the Parakeet (Melopsittacus undulatus) // Journal of Comparative Physiology. 1978. -Vol. 125.-P. 359-365.

145. Saunders J.C., Pallone R.L. Frequency selectivity in the parakeet studied by isointensity masking contours // Journal of Experimental Biology. 1979. -Vol. 87.-P. 331-342.

146. Scanlan J.P. Analysis of avian "speech": patterns and linear frequency sweeps (2 s, 0.5-11 kHz) with 10 ms raised cosine production // PhD thesis (London: University College). 1988.

147. Scharff C., White S.A. Genetic components of vocal learning // Annals of the New York Academy of Sciences.-2004.-Vol. 1016.-№ 1.-P. 325347.

148. Seaton W.H., Trahiotis C. Comparison of critical ratios and critical bands in the monaural chinchilla // Journal of the Acoustical Society of America. 1975.-V. 57.-P. 193-199.

149. Sinnott J. M. Detection and discrimination of synthetic English vowels by Old World monkeys (Cercopithecus, Macaca) and humans // Journal of the Acoustical Society of America. 1989. - V. 86. - P. 557-565.

150. Suthers R.A. Contributions to birdsong from the left and right sides of the intact syrinx // Nature. 1990. - Vol. 347. - № 6292. - P. 473-477.

151. Suthers R.A., Goller F., Pytte C. The neuromuscular control of birdsong // Philosophical Transactions of the Royal Society of London Series B: Biological Sciences. 1999. - Vol. 354. -№ 1385. - P. 927-939.

152. Todt D. From birdsong to speech: A plea for comparative approaches // Anais da Academia Brasileira de Ciencias. 2004. - Vol. 76. - № 2. - P. 201-208.

153. Todt D, Geberzahn N. Age-dependent effects of song exposure: song crystallization sets a boundary between fast and delayed vocal imitation // Animal Behavior. 2003. - Vol. 65. - № 5. - P. 971-979.

154. Troyer T.W, Doupe A.J. An associational model of birdsong sensorimotor learning I. Efference copy and the learning of song syllables // Journal of Neurophysiology. 2000a. - Vol. 84. - № 3. p. 1204-1223.

155. Troyer T.W., Doupe A.J. An associational model of birdsong sensorimotor learning II. Temporal hierarchies and the learning of song sequence // Journal of Neurophysiology. 2000b. - Vol. 84. -№ 3. - P. 1224-1239.

156. Watson C.S, Gengel R.W. Signal duration and signal frequency in relation to auditory sensitivity // Journal of the Acoustical Society of America. -1969. -V. 46.-P. 989-997.

157. Weisman R.G, Njegovan M.G, Ito S. Frequency ratio discrimination by Zebra Finches (Taeniopygia guttata) and Humans (Homo sapiens) // Journal of Comparative Psychology. 1994. - Vol. 108. - № 4. - P. 363372.

158. Weisman R.G, Njegovan M.G, Williams M.T, Cohen J.S, Sturdy C.B. A behavior analysis of absolute pitch: sex, experience, and species // Behavioral Processes. 2004. - Vol. 66. - № 3. - P. 289-307.

159. Westneat M.W, Long J.H.Jr, Hoese W, Nowicki S. Kinematics of birdsong: functional correlation of cranial movements and acoustic featuresin sparrows // Journal of Experimental Biology. 1993. - Vol. 182. - P. 147-171.

160. Whaling C.S., Solis M.M., Doupe A.J., Soha J.A., Marler P. Acoustic and neural bases for innate recognition of song // Proceedings of the National Academy of Sciences. 1997. - Vol. 94. - № 23. - P. 12694-12698.

161. Wilbrecht L., Nottebohm F. Vocal learning in birds and humans // Mental Retardation and Developmental Disabilities Research Reviews. 2003. -Vol. 9.-№3.-P. 135-148.

162. Wiley R.H. A new sense of the complexities of bird song // The Auk. -2000.-Vol. 117.-№4.-P. 861-868.

163. Williams H., Crane L.A., Hale Т.К., Esposito M.A., Nottebohm F. Right-side dominance for song control in the Zebra Finch // J. of Neurobiology. -1992.-V. 23.-P. 1006-1020.

164. Wright T. F. Regional dialects in the contact call of a parrot // Proc. Roy. Soc. (Ser. B). 1996. - V. 263. - P. 867-872.

165. Wright T.F., Cortopassi K.A., Bradbury J.W., Dooling R.J. Hearing and Vocalizations in the Orange-Fronted Conure (Aratinga canicularis) // Journal of Comparative Psychology. 2003. - Vol. 117. - № 1. - P. 87-95.

166. Wright T.F., Dorin M. Pair Duets in the Yellow-Naped Amazon (Psittaciformes: Amazona auropalliata): Responses to playbacks of different dialects // Ethology. 2001. - Vol. 107. - P. 111-124.

167. Wright T.F., Leischer R.C. Vocal dialects, sex-biased dispersal, and microsatellite population structure in the parrot Amazona auropalliata // Molecular Ecology. 2005. - Vol. 14. - № 4. - P. 1197-1205.