Авторефераты по темам >> Разные специальности - [часть 1] [часть 2]

Формирование многоязычной фонетической базы данных (применительно к речевой реализации вибрантов)

Автореферат кандидатской диссертации

На правах рукописи

ОСЕВА Елена Викторовна

ФОРМИРОВАНИЕ МНОГОЯЗЫЧНОЙ ФОНЕТИЧЕСКОЙ

БАЗЫ ДАННЫХ

(применительно к речевой реализации вибрантов)

Специальность 10.02.21 - Прикладная и математическая лингвистика

Автореферат

диссертации на соискание ученой степени

кандидата филологических наук

Москва - 2006

Работа выполнена на кафедре прикладной и экспериментальной лингвистики Государственного образовательного учреждения высшего профессионального образования МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ЛИНГВИСТИЧЕСКИЙ УНИВЕРСИТЕТ

Научный руководитель:аа доктора филологических анаук,

профессор, академик МАИ

Родмонга Кондратьевна Потапова

Официальные оппоненты: доктор филологических наук

Марк Ильич Каплун

кандидат филологических наук

ада Евгеньевна Панасюгина

Ведущая организация:аа Федеральное государственное научное

учреждение научно-исследовательский

институт Спецвузавтоматика

Защита диссертации состоится ла 18а декабряа а2006 г.а в а13а ачасов на заседании диссертационного совета Д 212.135.02 при ГОУ ВПО МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ЛИНГВИСТИЧЕСКИЙ УНИВЕРСИТЕТ по адресу: 119992, Москва, ГСП-2, ул. Остоженка, 38.

С диссертацией можно ознакомиться в диссертационном читальном зале библиотеки ГОУ ВПО МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ЛИНГВИСТИЧЕСКИЙ УНИВЕРСИТЕТ

Автореферат разослан ла 15а ааноябряаа а2006 г.а

Ученый секретарь

диссертационного совет ааВ.С. Страхова

Динамично развивающаяся корпусная лингвистика включает в настоящее время разработку корпусов не только письменных, но и звучащих текстов. Интерес к созданию корпусов звучащей речи в значительной степени вызван исследованиями в области автоматического распознавания и понимания речи, идентификации говорящего по голосу и речи, идентификации языка, на котором реализуется коммуникация. Исследователям приходится сталкиваться с акустической вариативностью звуковых единиц, которая имеет разнообразные источники - от системной контекстной вариативности, обусловленной коартикуляцией, до психофизиологического состояния говорящего или технических характеристик микрофона при записи речевого материала. Современные системы распознавания речи обучаются на больших массивах звучащей речи. Кроме того, проблема описания и моделирования звучащей речи с учетом ее акустической вариативности также представляет большой научный интерес.

В данной области речеведения к настоящему моменту накоплено достаточное количество информации. Однако существует и целый ряд еще нерешенных проблем, таких, например, как недостаточный доступ к корпусам данных разных стран, отсутствие унифицированного подхода. Исследования в области корпусной лингвистики включают: а) с учетом создания рабочего инструментария - формирование моно- и многоязычных корпусов текстов, средств кодирования и поиска; б) с учетом собственно лингвистических задач - проведение экспериментально-фонетических исследований.

Основным понятием корпусной лингвистики является база данных. База данных - совокупность однородных данных, организованных по определенным правилам и предназначенных для длительного хранения и постоянного использования в каком-либо виде человеческой деятельности. Формирование и ведение базы данных (обновление данных, их прием и выдача по запросам и т.д.) осуществляется автоматизированной системой управления базой данных [Иллюстрированный энциклопедический словарь 1997: 61].

Существует три способа взаимосвязи входящих в базу данных записей (моделей представления данных) [Зубов, Зубова 2004: 156]:

Иерархический: взаимосвязь данных представляется в виде дерева, состоящего из узлов. На самом верхнем уровне такой иерархии имеется только один узел - корень. Каждый узел, кроме корня, связан с одним из узлов на более высоком уровне (исходным для данного узла). Ни один элемент такой модели не имеет более одного исходного. Каждый элемент может быть связан с одним или несколькими элементами на более низком уровне, которые называются порожденными. Элементы, не имеющие порожденных элементов (расположенные в конце ветви), называются листьями.
Сетевой: в такой модели данных любое данное может быть связано с любым другим данным; при этом, как и в предыдущем типе, можно использовать понятия корня, исходных и порожденных элементов, листьев. Порожденные элементы обычно располагаются ниже исходных. Здесь также можно говорить об уровнях.
Реляционный: данные представляются в виде таблицы. Каждая таблица включает отношения между включенными в нее данными. Таблица - это набор кортежей (записей). Если кортежи являются n-мерными, то есть таблица имеет n столбцов, то отношение называется отношением степени n. Столбец с номером m называется m-ным доменом отношения.

В современной лингвистике нашли широкое применение различные базы данных и связанные с ними технологии. Речь идет о так называемых лингвистических информационных ресурсах, которые представляют собой множество определенным образом организованных речевых и языковых данных, находящихся на машинных носителях информации и используемых в различных сферах практической деятельности [Зубов, Зубова 2004: 156].

В общем виде лингвистические информационные ресурсы представляют собой своеобразные лингвистические базы данных, которые можно редактировать, обновлять и в которых можно осуществлять поиск информации. В наше время лингвистические информационные ресурсы необходимы как пользователям персональных компьютеров, так и различным компьютерным системам, связанным с обработкой речи и текста. Так, они используются для распознавания речи, реферирования, аннотирования, перевода текстов, автоматического анализа текста и т.д.

К лингвистическим информационным ресурсам относятся письменные текстовые массивы и фонетические лингвистические ресурсы. С ними связаны многие исследования и перспективы развития, относящиеся к разным проблемам и задачам современной лингвистики, а компьютеризация и использование новейших информационных технологий ускоряет развитие науки и повышает доступность ее достижений для пользователей [Потапова 2005].

Фонетические базы данных представляют собой источник информации о распределении параметров моделей звуковых единиц, необходимой для настройки и подгонки параметров систем распознавания речи, систем идентификации говорящего по голосу и речи, синтеза речи и тестирования этих систем [Потапова 1997: 478]. Фонетические знания, в том числе знания об артикуляторно-акустических характеристиках звуков, представленные в таких базах данных, должны быть максимально полными и точными. При этом определенные звуковые сегменты играют важную роль при решении задачи идентификации личности говорящего по голосу и речи [Потапова, Потапов 2006: 19].

Одним из таких звуковых сегментов является, например, вибрант (дрожащий), который обладает специфическими артикуляторными и акустическими характеристиками. Эти характеристики могут быть описаны как нечто среднее между признаками взрывного согласного и гласного. Они обладают огромной внутридикторской и междикторской вариативностью. В силу своей междикторской вариативности вибрант характеризуется большим потенциалом для идентификации говорящих [Jessen 2004: 289]. Так, вибрант может отличаться у разных говорящих, например, количеством смычных компонентов и амплитудой колебаний. Вследствие этого предположительно можно говорить о вибрантах как об одном из "опорных пунктов" при распознавании речи и идентификации говорящего [Jessen 2004: 289]. Однако при решении данных задач помехой будет являться внутридикторская вариативность, обусловленная позиционно-комбинаторными факторами.

Вибрант является одним из самых трудных для произнесения звуков в различных языках мира. Об этом свидетельствует тот факт, что во многих языках этот звук появляется поздно в речи детей и часто в своих индивидуальных, отклоняющихся от нормы (девиационных) реализациях [Dalston 1974]. Нередко девиационное произнесение [r]-звуков так и остается в речи уже взрослого человека [Волкова и др. 1989; 2004]. При изучении иностранного языка этот звук также может доставлять немалые трудности как обучающемуся при освоении звука, так и обучающему при постановке произношения.

Актуальность данного исследования определяется необходимостью решения проблем автоматизации процесса идентификации говорящего по голосу и речи с опорой на звучащую речь, а также языка, на котором реализуется сообщение, создания новых и развития уже имеющихся систем идентификации в условиях информатизации всех сторон деятельности человека и общества, пополнения имеющихся фонетических баз данных (БД) и формирования новых БД. Знание по возможности точных артикуляторных и акустических характеристик речи является важным для успешного решения вышеуказанных проблем.

Научная новизна диссертации состоит в том, что впервые был проведен экспериментально-фонетический сопоставительный анализ вибрантов на материале четырех языков (русского, британского варианта английского языка, немецкого, чеченского) для разных видов речевой деятельности; впервые выявлены сходные и специфические признаки фонетических систем вибрантов для указанных выше языков и определены универсалии реализаций вибрантов в разных видах речевой деятельности (квазиспонтанном/ спонтанном говорении, подготовленном/ неподготовленном чтении); впервые сформирована фонетическая база данных [r]-звуков на материале вышеуказанных языков.

Рабочей гипотезой является предположение о том, что фонетические системы вибрантов русского, немецкого, английского и чеченского языков обладают как сходными, так и специфическими артикуляционно-акустическими признаками. Предполагается также, что реализации вибрантов в разных видах речевой деятельности (подготовленном/ неподготовленном чтении, квазиспонтанном/ спонтанном говорении) характеризуются также с позиции наличия универсалий, то есть закономерностей, общих для данных языков.

Основная цель диссертации заключалась в выявлении сходных и специфических признаков систем вибрантов в русском, английском, немецком и чеченском языках и определении универсалий реализации вибрантов при разных видах речевой деятельности. Данная цель обусловила необходимость решения следующих задач диссертационного исследования: проведения сопоставительного анализа фонетических систем вибрантов исследуемых языков и формирования фонетической базы данных на материале речевых реализаций вибрантов в русской, английской, немецкой и чеченской речи.

Материалом исследования послужили аутентичные звучащие тексты с учетом двух видов речевой деятельности: подготовленного/ неподготовленного чтения и квазиспонтанного/ спонтанного говорения (длительность материала: 3 часа для русского языка, 4 часа для английского, 1 час для немецкого, 20 часов для чеченского). В качестве дикторов выступали носители исследуемых языков, при отборе которых учитывались различия по половому признаку и диалектальной принадлежности (16 дикторов для русского языка, 36 дикторова для английского языка, 17 дикторов для немецкого языка, 131 диктор для чеченского языка).

Достоверность и обоснованность выводов обеспечивается достаточным объемом использованного в ходе исследования звучащего материала и достаточным количеством дикторов ( 28 часов и 200 дикторов).

Объектом исследования является изучение микросегментации слитной звучащей речи (по Р.К.Потаповой) по материалам четырех вышеупомянутых языков. В качестве предмета исследования были рассмотрены вибранты в английском, немецком, русском и чеченском языках, являющихся репрезентантами германских языков, славянского языка (соответственно западногерманская и восточнославянская подгруппы индоевропейской семьи языков) и типологически неродственного им кавказского языка (нахская подгруппа восточнокавказских языков иберийско-кавказской семьи). Проведен сопоставительный анализ с целью определения наличия/ отсутствия универсалий в данных языках.

Положения, выносимые на защиту:

Системы аллофонических реализаций вибрантов различных языков обладают общими артикуляционно-акустическими признаками.
Система вибрантов каждого из рассматриваемых языков характеризуется набором специфических артикуляционно-акустических признаков.

Теоретическая значимость работы заключается в дальнейшем развитии теории корпусной лингвистики применительно к звучащим текстам, теории звуковых систем в экспериментальной фонетике, а также компаративистики применительно к фонетическому (в данном случае сегментному) уровню языка.

Практическая ценность диссертации заключается в том, что полученные данные с учетом артикуляторных и акустических характеристик аллофонических реализаций вибрантов для рассматриваемых четырех языков применительно к различным видам речевой деятельности могут быть использованы для пополнения имеющихся фонетических баз данных, в частности, в автоматизированных системах идентификации говорящего по голосу и речи, а также в системах автоматического распознавания и синтеза речи. На основе полученных данных могут быть разработаны рекомендации экспертам-фоноскопистам. Результаты исследования могут послужить также лекционным материалом по прикладному речеведению.

Основные результаты работы были апробированы на различных конференциях: 13-й Международной конференции Информатизация и информационная безопасность правоохранительных органов (Академия Управления МВД, Москва, 25-26 мая 2004 г.), 15-й Сессии Российского акустического общества, Нижегородской акустической научной сессии (Нижний Новгород, 15-18 ноября 2004 г.), Международной конференции "Стилистика и теория коммуникации", посвященной 100-летию со дня рождения И.Р. Гальперина (Москва, 20-21 апреля 2005 г.), ежегодных Международных чтениях памяти Н.С. Трубецкого Евразия на перекрестке языков и культур. Языки и культуры в контакте (Москва, 21 апреля, 2005 г.), Международной конференции Forum Acusticum 2005 (Будапешт, Венгрия, 29 августа - 2 сентября 2005 г.), 10-й Международной конференции SPECOMТ2005 (СРечь и компьютерТ) (Патры, Греция, 17-19 октября 2005 г.), 11-й Международной конференции SPECOMТ2006 (СРечь и компьютерТ) (Санкт-Петербург 25-29 июня 2006 г.), Международной конференции Международной ассоциации по акустике и судебной фонетике IAFPA 2006 (Гётеборг, Швеция, 23-27 июля 2006 г.), 18-й Сессии Российского акустического общества (Таганрог, 11-15 сентября 2006 г.), а также обсуждалась на заседаниях кафедры прикладной и экспериментальной лингвистики Московского государственного лингвистического университета.

Цели и задачи исследования обусловили структуру диссертации, которая состоит из введения, трех глав, заключения, списка использованной литературы и приложений.

Первая и вторая главы посвящены теоретическому анализу исследуемой проблемы.

В первой главе диссертационного исследования дается описание современного состояния корпусной лингвистики и некоторых корпусов текстов, дается определение фонетическим базам данных, обосновывается необходимость и актуальность создания таких баз данных, перечисляются требования, предъявляемые к современным фонетическим базам данных, приводится в качестве примера ряд существующих отечественных и зарубежных фонетических баз данных, таких, как RuSpeech, MultiSpeech, DARPA TIMIT Database.

Вторая глава посвящена непосредственно описанию вибрантов. В ней дается обзор систем вибрантов в некоторых языках мира: английском, немецком, французском, испанском, итальянском, чешском, словацком, венгерском, новогреческом, шведском, финском, чеченском, японском, китайском, иврите, гиляцком (нивхском), бенгали, пенджаби. Выявлено, что аллофонический ряд, представляющий фонему /r/, отличается от языка к языку. В языке может быть более двух плавных: существуют языки с четырьмя, тремя, двумя плавными и даже с одним плавным звуком [Трубецкой 1960]. Так, в испанском помимо обычного вибранта имеется особый раскатистый /r:/. В тех языках, которые наряду с апикальным рядом шумных имеют также ретрофлексный, обычные плавные могут получать соответствующие пары. Например, в бенгали существуют две /r/-образных фонемы, а в пенджаби к ним добавляется два латерала [Кодзасов, Кривнова 2001: 448]. В финском языке имеется краткий /r/ и долгий /r:/ [Jessen 2004: 289]. К языкам с одним единственным плавным относятся китайский и японский. В японском языке /r/ является единственным плавным (тогда как в китайском это /l/). Единственной фонемой, которой противостоит /r/ в качестве члена одномерной оппозиции, является мягкий /r'/. Но так как все японские согласные имеют мягкие соответствия, то это соотношение с /r'/ нельзя рассматривать как специфическую особенность /r/. Поэтому, по мнению Н.С. Трубецкого, японский /r/ следует определить как немягкий плавный. Чаще всего /r/ реализуется как одноударный согласный. Увулярная артикуляция здесь невозможна, ибо это окажет влияние на пропорциональность оппозиции /r/-/r'/ [Трубецкой 1987].

Рассматривается особенность вибранта выступать во многих языках в качестве слогоносителя, сочетания и комбинации, в которые может входить фонема /r/ в разных языках, девиационные реализации, то есть реализации, считающиеся отклонениями от общепринятой нормы в силу диалектных особенностей, социалектных факторов (социального происхождения), патологических отклонений, индивидуальных особенностей; описывается механизм появления оглушенных, фрикатизированных вибрантов, невозможность назализации дрожащих с позиций аэродинамики. Особо детальное описание дается артикуляторным и акустическим характеристикам аллофонических реализаций вибрантов в русском, английском, немецком и чеченском языках, поскольку вибранты именно в перечисленных языках находятся в центре внимания диссертационного исследования.

Русские непалатализованный и палатализованный вибранты являются альвеолярными переднеязычными какуминальными дрожащими, формантные частоты которых находятся в диапазонах F1 ~ 400-600 Гц, F2 ~ 1300-1600 Гц, F3 ~ 1800-2300 Гц [Кодзасов, Кривнова 2001: 181]. Английский вибрант - это постальвеолярный апикальный аппроксимант в британском варианте и ретрофлексный аппроксимант в американском варианте с F1 ~ 300 Гц, F2 ~ 1000 Гц и характерной низкой F3 ~ 1600 Гц [Jones 1967; 1939; Кодзасов, Кривнова 2001: 180]. Немецкий вибрант по современным данным может быть в равной степени представлен велярным фрикативным (F1а ~ 464 Гц, F2а ~ 1072 Гц, F3 ~ 2324 Гц), переднеязычным апикально-альвеолярным дрожащим с F1а ~ 500 Гц, F2а ~ 1200 Гц , F3 ~ 1970 Гц аили увулярным дрожащим, характеризующимся формантами F1 ~ 490 Гц, F2 ~ 1150 Гц, F3 ~ 2310 Гц [Kramer 1979; Pabst-Weinschenk 2004: 36]. Спектральное описание чеченских вибрантов в специальной литературе, к сожалению, отсутствует: акустические характеристики данных звуков в чеченском языке представляют собой широкое поле для экспериментально-фонетических исследований.

Третья глава содержит обсуждение проведенного экспериментально-фонетического исследования. В ней излагается материал с учетом созданной базы данных и отдельные наблюдения, а также выводы относительно артикуляторных и акустических характеристик вибрантов в исследуемых языках. В качестве русскоязычного речевого материала использовался фрагмент речевой базы данных, созданной коллективом исследователей В - РАН [Kouznetsov, Chuchupal, Makovkin 1999: 179-181] как Государственный стандарт 16600-72, определяющий требования к разборчивости речи при ее передаче по трактам радиотелефонной связи [ГОСТ 16600-72 1973]. Соотношение частоты встречаемости твердых и мягких вибрантов в 510 фонетически сбалансированных фразах, длиной в 3-5 слов, близко к соотношению вибрантов в русской речи в целом [Kouznetsov 2003]. В записи базы данных принимали участие 6 дикторов (3 мужчины и 3 женщины); объем речевого материала составил 2 часа. В описанном речевом материале был представлен такой вид речевой деятельности как чтение. В качестве речевого материала послужила также запись пересказа мультфильма 10 дикторами (5 мужского пола и 5 - женского) длительностью 1 час. Таким образом, было охвачено и говорение.

Для исследования английских [r]-звуков использовалась часть базы данных Corpus IviE (Intonational Variation in English, UK ESRC award R000237145), составленной фонетической лабораторией Оксфордского университета и Центром речеведения и языкознания Кембриджского университета. База данных представляет диалекты 9 регионов Англии; ее объем составляет 36 часов. В виду большого объема этой базы данных были выбраны диалекты Кэмбриджа, Кардиффа и Дублина. Длительность проанализированного речевого материала составила 4 часа. В качестве дикторов выступали 6 девушек и 6 юношей из каждого района. Участникам эксперимента предлагались 5 заданий: чтение 22 фонетически сбалансированных предложений с различными грамматическими структурами, чтение сказки УЗолушкаФ, пересказ данной сказки, задание по карте в парах, рассуждение на заданную тему в парах (на тему "курение"). Таким образом, учитывались различные виды речевой деятельности: подготовленное и неподготовленное чтение (чтение предложений и сказки), спонтанное и квазиспонтанное говорение (пересказ сказки, задание по карте, диалог); задействована монологическая и диалогическая речь.

Речевой материал на немецком языке включал фразы и небольшие тексты, взятые с немецких демонстрационных CD, где дикторы обоих полов читали и говорили на тему новейших технологических достижений. Речевой материал был получен также из Интернета (репортажи и интервью c Интернет-сайта радио HR2). Объем речевого материала составил около 1 часа. Анализировались записи 17 дикторов.

Чеченский речевой материал был получен в рамках научно-исследовательской работы, проводящейся на кафедре прикладной и экспериментальной лингвистики МГЛУ (научный руководитель д-р филол. наук, проф. Р.К. Потапова): объем собранного звучащего материала составил 20 часов, источником послужили Интернет-сайты радиостанций "Свобода" и "Chechnya Free" [Отчет о выполнении научно-исследовательской работы по теме Разработка и создание транскрибированных баз данных для испанского языка Шифр Фонема-И, МГЛУ 2005]. Основная часть звучащего материала (более 12 ч) представляет собой запись спонтанной и квазиспонтанной речи носителей чеченского языка (вид речевой деятельности - говорение). Другая часть речевого материала представляет такой вид речевой деятельности, как чтение (уроки чеченского языка, запись носителей языка). Количество дикторов составляет 96 мужчин и 35 женщин. Для данного экспериментального исследования была взята лишь часть речевого материала, содержащая [r]-звуки. Отобранный речевой материал был отсегментирован, а затем затранскрибирован при помощи МФА (Международного фонетического алфавита) и современного Международного фонетического алфавита SAMPA.

В результате экспериментального исследования в русской речи выделены следующие аллофоны:

а) по количеству ударов

для твердого вибранта н - без удара (10,7 %), одноударные (85,8 %), двухударные (3,2 %), трехударные (0,1 %), четырехударные (0,2 %);
для мягкого вибранта - без удара (10,3 %), одноударные (89,2 %), двухударные - (0,6 %).

аНаиболее часто встречающимися в данном материале являлись одноударные аллофоны вибрантов.

б) по качеству компонентов выделены следующие аллофоны:

для твердой фонемы: основной вариант (84,4 %), фрикатизированный (2,9 %), оглушенный (5,1 %), назализованный (0,6 %), аппроксимант (6,4 %), скрипучий (0,6 %);
для мягкой фонемы: основной вариант (91 %), аппроксимант (7,3 %), оглушенный (1,4 %), скрипучий (0,3 %). Пример осциллограмм и спектрограмм оглушенного и скрипучего аллофонов мягкой фонемы приведен на рис. 1.

Рис. 1. Русские оглушенный палатализованный вибрант в слове 'панцирь' (слева) и скрипучий палатализованный вибрант в слове 'геометрию' (справа)а

Акустический анализ английских вибрантов показал, что во всех контекстах с учетом позиционно-комбинаторных факторов и видов речевой деятельности английский вибрант в диалектах Кэмбриджа и Кардиффа в большинстве случаев реализуется как апикальный аппроксимант (94 %). В диалекте Дублина большую часть реализаций составили ретрофлексные аппроксиманты (81 %), что и следовало ожидать [Internet: Что касается связывающего /r/, то было обнаружено, что в спонтанной речи испытуемые-женщины реже произносят связывающий вибрант по сравнению с мужчинами, что совпадает с предположениями Лори Бауэр [Bauer 1984]. По качеству связывающий /r/ также чаще реализовывался в виде аппроксиманта. Редким исключением являлся дрожащий [r] (пример осциллограмм и спектрограмм реализаций связывающего /r/ приведен на рис.2).

Рис. 2. Английские связывающие аппроксимант на стыке слов 'are on' (слева) и вибранта на стыке слов 'were in' (справа)

Немецкие вибранты реализовывались в большинстве контекстов как увулярные вибранты (в 38,39 % случаев, принимая во внимание тот факт, что 56,4 % приходилось на вокалические аллофоны, что было обусловлено контекстом) (см. рис.3). Несмотря на современные литературные данные, лишь небольшой процент от общего числа реализаций составляли увулярные фрикативные и переднеязычные звуки: 1,42 % - увулярные фрикативные, 2,37 % - переднеязычные аппроксиманты, 1,42 % - переднеязычные вибранты.

Рис. 3. Немецкие увулярный вибрант в слове 'Roboter' (слева) и

вокалический аллофон в слове 'Forscher' (справа)

Наличие вокалического /r/, согласно проведенным измерениям, приводило к тому, что предшествующие гласные заднего ряда становились более передними, а гласные переднего ряда, наоборот, под влиянием вокалического /r/ - более задними.

По результатам акустического и перцептивно-слухового видов анализа чеченскиеа [r]-звуки в исследуемом речевом материале реализовывались, в основном, в виде одноударных вибрантов (92%), что согласуется с наблюдениями Йоханны Николс [Nichols 2005].

В речевом материале имеются образцы изолированного произнесения твердого вибранта как женщиной, так и мужчиной. При произнесении данного звука женщиной вибрант имеет три смычных компонента, что вполне объяснимо в данных условиях (изолированный звук, медленный темп речи). Формантные частоты изолированно произнесенного женщиной чеченского вибранта имеют следующие значения: F1 ~ 630 Гц, F2 ~ 1627-2047 Гц, F3 ~ 2940 Гц.

Интересно, что произнесенный диктором-мужчиной изолированный вибрант является увулярным. Некоторые дикторы также произносили увулярные вибранты наряду с аналогичными русским переднеязычными, причем в одних и тех же словах (например, 'Иракъ'), что необходимо исследовать подробнее. Формантные частоты изолированно произнесенного мужчиной чеченского вибранта имеют значения: F1 ~ 530 Гц, F2 ~ 1439-1546 Гц, F3 ~ 3092-3625 Гц.

Зафиксированы случаи произнесения оглушенных твердых вибрантов, в частности, частично оглушенных вибрантов, которые встречались после глухих взрывных (например, в слове 'трамвайн', см. рис.4). Встречались в речевом материале фрикатизированные аллофоны, на спектрограмме которых отчетливо наблюдался фрикативный шум, появившийся под влиянием последующих глухих фрикативных (см. рис.4). В отдельных случаях наблюдался глухой вибрант. Однако о тенденции здесь говорить не приходится, так как некоторые дикторы произносили в данной морфеме звонкий вибрант. Можно, правда, отметить небольшой оглушенный участок на конце вибранта, который занимает не более одной четверти длительности рассматриваемого звука, но в целом это звонкий вибрант. Как и отмечали И.Ю. Алироев, А.Д. Тимаев и М.Р. Овхадов [Алироев, Тимаев, Овхадов 1998], в позиции конца слов и фраз наблюдалось ослабление вибрантов.

Рис. 4. Чеченские частично оглушенный вибрант в слове 'трамвайн' ("трамвай") (слева) и фрикатизированный вибрант в слове 'оршот' ("понедельник") (справа)

В настоящем исследовании представлены результаты анализа вибрантов в разных языках, проведенного в "системе координат", "осями" которой являются фонологический и фонетический языковые уровни. С целью получения полной картины о системах вибрантов исследовался фонемный состав вибрантов: фонологический уровень представляет отдельный интерес при проведении сопоставительного анализа систем вибрантов, поскольку существуют языки, где представлены несколько дрожащих фонем: палатализованный вибрант /r'/ в русском и японском, функционирующий в языках вместе с твердыми фонемами; финскаяа и испанская долгие фонемы /r:/; чешский шумный вибрант /r/, противопоставленный обычному чешскому плавному /r/; вибранты в гиляцком (нивхском) языке, где наряду со звонким /r/ существует глухой /?/ с отчетливым фрикативным шумом; две /r/-образные фонемы в бенгали. Для того чтобы считать исследование фонемы полным, необходимо рассмотреть сочетания, в которые она вступает с другими фонемами [Трубецкой 1987]. Русские твердый и мягкий вибранты /r/ и /r'/ могут появляться во всех фонетических положениях, глухие вибранты /r?/, /r'?/ не могут находиться перед ударными и безударными /a-o-e-u-i/, с /o/ сочетаются лабиализованные варианты /r?/ и /r'?/, /r/ и /r'/ не могут следовать за мягкими зубными (кроме /l'/). Русские твердый и мягкий вибранты сочетаются с губными, зубными, передненебными и задненебными согласными [Матусевич 1986]. Английский вибрант также употребляется во всех фонетических положениях. Минимальный контекст определяет те или иные аллофонические реализации. Вместо характерной щелевой артикуляции со срединным протоком, в интервокальном положении, а также после зубного /?/ может употребляться одноударный аллофон (СveryТ, СthreeТ). В зависимости от качества предшествующего согласного аллофоны /r/ могут быть, например, шумными (после смычных /t/, /d/) или частично оглушаться (после глухих согласных). Немецкий вибрант может стоять как в начальной, так и в конечной позиции слова; исключены сочетания 'au + r', 'ai + r' [Потапова 2002]. Чеченский вибрант также реализуется по-разному в зависимости от позиции: характерным для нахских языков и диалектов чеченского языка является процесс ослабления и последующего выпадения /r/ в конечном положении [Алироев, Тимаев, Овхадов 1998: 56].

Аллофонические ряды, представляющие фонему /r/, отличаются в рассматриваемых языках, но наблюдаются и пересечения этих множеств. Так, в современном немецком произношении все чаще употребляется переднеязычный вибрант, как и в русском. Реализации чеченских вибрантов также близки по своим характеристикам к русским. Однако при этом обладают более напряженной артикуляцией. В представленном немецком экспериментальном материале большинство аллофонов составляли увулярные реализации, что отличается от современных теоретических данных. Для чеченского речевого материала было выявлено наличие увулярных вибрантов, доля реализации которых незначительна.

В результате экспериментального исследования впервые была сформирована фонетическая база данных [r]-звуков, которая структурирована по следующим признакам:

язык (русский, британский вариант английского языка, немецкий, чеченский);
пол дикторов (мужской, женский);
виды речевой деятельности (спонтанное/ квазиспонтанное говорение, подготовленное/ неподготовленное чтение);
положение вибрантов во фразе;
положение вибрантов по отношению к границам слов;
минимальная контекстуальная дистрибуция.

Материал представлен в виде .wav-файлов и .nsp-файлов, которые отсегментированы и затранскрибированы с помощью МФА и современного Международного фонетического алфавита SAMPA.

В результате проведенного анализа можно выделить следующие сходные артикуляционно-акустические признаки систем вибрантов в исследуемых языках:

Дрожащие реализации вибрантов, как и было показано в теоретической части, действительно состояли из вокалических и смычных компонентов.
Дрожащие аллофоны в большинстве случаев реализуются с одним смычным компонентом.
Частично и полностью оглушенные аллофоны появляются в речи после глухих звуков.
Фрикатизированные аллофоны встречаются, в основном, перед фрикативными согласными.

Были выявлены также следующие отличительные признаки систем вибрантов в рассматриваемых языках:

Необходимо отметить артикуляторное различие вибрантов в исследуемых языках, обусловливающее специфическую акустическую картину, которое было описано в теоретической части и в основном подтверждено результатами экспериментального исследования.
В русском языке это переднеязычные какуминальные вибранты, характеризующиеся формантными частотами: непалатализованный вибрант - F1 ~ 400а (в теории 400-600) Гц, F2 ~ 1300-1600 Гц, F3 ~ 1800-2300 Гц, палатализованный вибрант - F1 ~ 390 (в теории 400-600) Гц, F2 ~ 1500-1900 Гц, F3 ~ 2300-2500 Гц.
Вибранты английской фонетической базы данных реализовывались как апикальные аппроксиманты, за исключением диалекта Дублина, где они были представлены ретрофлексными аппроксимантами, что соответствует утверждениям, цитируемым в обзоре теоретическогоа материала по исследуемой проблематике. Английские аппроксиманты могут быть описаны следующей F-картиной: F1 ~ 337 Гц, F2 ~ 1077 Гц, F3 ~ 1589 Гц, что фактически совпадает с литературными данными: F1 = 300 Гц, F2 = 1000 Гц, F3 = 1600 Гц.
Немецкие вибранты реализовывались в большинстве контекстов как увулярные вибранты, что и подтверждается общими по всем минимальным контекстам средними значениями формант: F1 ~ 454 Гц, F2 ~ 1257 Гц, F3 ~ 2334 Гц. Согласно литературным данным, увулярный вибрант в немецком языке можно описать формантными частотами F1 ~ 490 Гц, F2 ~ 1150 Гц, F3 ~ 2310 Гц.
Чеченские вибранты являются переднетвердонебными и имеют сходную с русскими вибрантами артикуляцию, но отличительной чертой по сравнению с соответствующими русскими звуками является более напряженная артикуляцияа - признак, сближающий чеченскую систему вибрантов с английской и немецкой. Измеренные по динамическим спектрограммам значения формантных частот чеченских вибрантов равны в среднем F1 ~а 687 Гц, F2 ~ 1799 Гц, F3 ~ 2936 Гц; для заимствованных из русского языка мягких вибрантов в чеченском - F1 ~а 576 Гц, F2 ~ 2234 Гц, F3 ~ 3009 Гц.

Рис. 5. Формантные значения вибрантов в исследуемых языках согласно экспериментальным данным (средние по всем контекстам и аллофоническим реализациям)

Для английского языка характерно деление [r]-звуков на темные и светлые. Является ли звук светлым или темным, определяется в зависимости от положения фонемы в слоге и от взаимоотношений между гласным и рассматриваемым согласным. Темный /r/ реализуется перед гласным, а светлый /r/ - после гласного внутри слога. Это несвойственно другим рассматриваемым языкам.
В английском языке наблюдается также такое отличительное явление, как связывающий /r/.
Для немецкого характерно выделение вокалического аллофона [?], который появляется в определенных позициях, например, после долгих гласных. Этот гласноподобный аллофон часто характеризуют как более открытый вариант /?/. В отличие от системы вибрантов в немецком языке системы вибрантов в других языках характеризуются наличием только консонантных аллофонов. Хотя следует отметить, что английский /r/ называют полугласным, F-картина которого сходна с ближайшим по артикуляции гласным [?а ?].
В русском языке выделяются непалатализованная и палатализованная /r/-фонемы. То же самое можно сказать и о чеченском языке, где мягкий /r'/ заимствован из русского языка. Несмотря на тот факт, что чеченский язык является типологически неродственным остальным исследуемым языкам, в том числе русскому, он подвергся значительному влиянию русского языка, что исторически обусловлено. Ни в английском, ни в немецком языках палатализованной фонемы не существует.
В чеченском языке в отличие от всех остальных исследуемых языков выделяют глухую фонему /rh/. Следует отметить, что частично оглушенные и реже полностью оглушенные [r]-аллофоны свойственны системам вибрантов всех рассматриваемых языков, о чем свидетельствуют теоретические данные и что подтверждается экспериментальным исследованием. Возможно, в чеченском языке существуют более благоприятные фонетические условия для появления глухих вибрантов, и их статистическая значимость приводит к необходимости выделения отдельной фонемы.

Основные положения диссертации отражены в следующих публикациях:

Потапова Р.К., Лосева Е.В. Корпус фонетических реализаций вибрантов (статья) // Сб. трудов 18-й сессии Российского акустического общества (Таганрог, 11-15 сентября 2006 г.) - М. 2006 - 0,3 п.л..: доля автора - 0,15 п.л.
Потапова Р.К., Лосева Е.В., Стаценко О.Н. Некоторые направления исследований в области криминалистической фонетики в Центре фундаментального и прикладного речеведения МГЛУ (статья на английском языке) // Сб. трудов Международной конференции IAFPA 2006 (Гётеборг, Швеция, 23-26 июля 2006 г.) Гётеборг, Университет Гётеборга, Факультет лингвистики, 2006 - 0,2 п.л.: доля автора - 0,07 п.л.
Потапова Р.К., Лосева Е.В. К проблеме создания многоязычной фонетической базы данных: вибранты в английском, немецком, русском и чеченском (статья на английском языке) // Сб. трудов 11-й Международной конференции SPECOMТ2006 (СРечь и компьютерТ), (Санкт-Петербург, 25-29 июня 2006 г.) Санкт-Петербург, СПИИРАС, 2006 - 0,3 п.л.: доля автора - 0,15 п.л.
Потапова Р.К., Лосева Е.В. Вариативность вибрантов в речи: фонетическая база данных для английского и немецкого языков (статья на английском языке) // Сб. трудов 10-й Международной конференции SPECOMТ2005 (СРечь и компьютерТ), (Патры, Греция, 17-19 октября 2005 г.) М., МГЛУ, 2005 - 0,3 п.л.: доля автора - 0,2 п.л.
осева Е.В. Формирование многоязычной фонетической базы данных (сравнительный анализ вибрантов в русской, английской и немецкой речи) (статья на английском языке) // Сб. трудов Международной конференции Forum Acusticum 2005 (Будапешт, Венгрия, 29 августа - 2 сентября 2005 г.) (на CD) Будапешт, 2005а - 0,4 п.л.
осева Е.В. Вибрант в немецкой речи: норма и аллофоническое варьирование (статья) //а "Вестник МГЛУ" N 507, М., МГЛУ, 2005 - 0,4 п.л.
осева Е.В. Формирование фонетической базы данных лингвокриминалистического назначения (на материале вибрантов в русской, немецкой и английской речи) (статья) // Сб. трудов 15-й сессии Российского акустического общества (Нижний Новгород, 15-18 ноября 2004 г.) - М., ГЕОС, 2004 - 0,9 п.л.
осева Е.В. Формирование фонетической базы данных экспертно-криминалистического назначения (на материале вибрантов в русской речи) (статья) // Сб. трудов 13-й Международной конференции СИнформатизация и информационная безопасность правоохранительных органовТ (Академия Управления МВД России, Москва, 25-26 мая 2004 г.) - М., 2004 - 0,4 п.л.
осева Е.В. Проблема постановки произношения в рамках дистанционного обучения иностранному языку: норма и аллофоническое варьирование вибранта в английской речи (статья) // Научные труды МИМ ЛИНК: Выпуск 13, Жуковский, 2005 - 0,7 п.л.
осева Е.В. Изменение характеристик вибрантов при различных видах речевой деятельности (на материале русского, английского и немецкого языков) (тезисы доклада) // Сб. трудов Международной конференции "Стилистика и теория коммуникации", посвященной 100-летию со дня рождения И.Р.Гальперина. (Москва, 20-21 апреля 2005 г.) - М., МГЛУ, 2005 - 0,04 п.л.
осева Е.В. Экспериментально-фонетическое исследование русского консонантизма и вокализма (Акустика речи и акустические проблемы прикладной лингвистики: 13-я сессия Российского акустического общества, Москва, 25-29 августа 2003 г.) (статья) // ИНИОН РАН, РЖ Языкознание М., 2005 - 0,1 п.л.
осева Е.В. Некоторые аспекты судебной фонетики в России (12-я международная научная конференция СИнформатизация и информационная безопасность правоохранительных органовТ, Москва, 20-21 мая 2003 г.) (статья) // ИНИОН РАН, РЖ Языкознание М., 2005 - 0, 2 п.л.
осева Е.В. Производство и восприятие речи (8-я международная конференция SPECOMТ2003 (СРечь и компьютерТ), 27-29 октября 2003 г.) (статья) // ИНИОН РАН, РЖ Языкознание М., 2005 - 0,2 п.л.
осева Е.В. Системы распознавания и понимания речи (8-я международная конференция SPECOMТ2003 (СРечь и компьютерТ), 27-29 октября 2003 г.) (статья) // ИНИОН РАН, РЖ Языкознание М., 2005 - 0,2 п.л.

Авторефераты по темам >> Разные специальности - [часть 1] [часть 2]