Компьютерное представление звуковой информации
Дипломная работа - Компьютеры, программирование
Другие дипломы по предмету Компьютеры, программирование
?ть во внимание, что БПФ - это всего лишь один из многих инструментов анализа сигналов, математически устроенный определенным образом и обладающий некоторыми парадоксальными свойствами. То, что любой сигнал можно представить (используя БПФ) суммой "гармонических" гармоник с постоянными во времени амплитудами, вовсе не означает, что физически сигнал на самом деле был сгенерирован в виде такой суммы! Например, реальный сигнал может быть физически сгенерирован как сумма нескольких быстро затухающих или возрастающих синусоидальных колебаний с произвольными некратными частотами. Однако его оцифрованный с некоторой частотой дискретизации отрезок произвольной длительности математически с помощью БПФ всегда можно представить в виде суммы "чистых" гармоник с постоянной амплитудой, что значительно усложнит нам понимание истинной природы анализируемого сигнала и его синтез. Например, БПФ короткого отрезка быстро затухающей одиночной синусоиды даст широкий спектр, состоящий из десятков гармонических сигналов. Естественно, такой сигнал гораздо сложнее генерировать с вычислительной точки зрения, чем одиночную синусоиду с быстро уменьшающейся амплитудой. Следовательно, БПФ малопригодно для анализа гармонической структуры музыкального сигнала (с целью использования результатов анализа для синтеза) на стадии атаки и, в некоторых случаях, на стадии затухания.
На стадии поддержки БПФ позволяет провести довольно детальные исследования. Однако точность анализа с помощью простейшей формы БПФ, доступной в программах CoolEdit и WaveLab, ограничена величиной, равной 1/T Гц, где T - длина в секундах подвергавшегося БПФ участка сигнала. Положим, мы исследуем сигнал, состоящий из 4410 отсчетов при частоте дискретизации 44,1 кГц. Длина его по времени составит 0,1 секунды, и, следовательно, точность измерения частот гармоник с использованием БПФ не превысит 10 Гц, а это весьма заметная для музыканта ошибка. Надо заметить, что нота длинной 0,1 секунды - не такая уж большая редкость в реальных музыкальных произведения. Но получается, что с помощью простейших форм БПФ измерить с приемлемой точностью (0,1-0,5 Гц) частоту основного тона музыкального звука в этом случае практически невозможно. Поэтому при анализе спектра сигналов используют метод сверхвысокого разрешения Прони. В этом методе сигнал представляется в виде суммы затухающих или нарастающих синусоид, частоты которых вычисляются с высочайшей точностью в процессе анализа сигнала по формулам Прони и могут не образовывать гармонический ряд. Данный метод гораздо больше, чем БПФ, соответствует физической природе музыкальных сигналов и позволяет проводить анализ звуков на стадии атаки и затухания.
Почему же так важен анализ спектров музыкальных сигналов? Дело в том, что сигналы, имеющие сходные амплитудные спектры (БПФ или Прони), имеют сходное звучание, хотя форма сигналов во временной области при этом может существенно различаться. Простейший пример - два отрезка белого шума. Звучат они одинаково (шипение), а вот их временные отсчеты (или осциллограммы) могут не совпадать ни в одной точке! Зато их усредненные БПФ-спектры будут одинаковыми. Некоторые методы синтеза (в частности, частотной модуляции) музыкальных звуков интенсивно используют это свойство человеческого слуха.
Синтез музыкальных звуков
Обобщенно технология создания музыкальных звуков в современных электромузыкальных цифровых синтезаторах выглядит так: с помощью цифрового устройства, использующего волновой табличный, частотно-модуляционный, физического моделирования, аддитивного гармонического синтеза и другие методы, генерируется так называемый сигнал возбуждения с заданной высотой звука. Он должен иметь спектральные характеристики, максимально похожие на характеристики имитируемого музыкального инструмента на стадии поддержки. Затем сигнал возбуждения подается на фильтры, имитирующие амплитудно-частотные характеристики излучающих звук поверхностей (корпус, дека и т. д.) реальных музыкальных инструментов, и управляемые сигналом амплитудной огибающей фильтры, создающие эффект большего количества высоких частот во время стадии атаки и последующего их уменьшения. Одновременно формируется амплитудная огибающая сигнала с помощью умножения временных отсчетов сигнала на временные отсчеты образцовой для данного типа реального музыкального инструмента амплитудной огибающей. Могут быть добавлены частотное и амплитудное вибрато.
Далее обычно сигнал обрабатывается электронными звуковыми эффектами реверберации и хоруса. Иногда используются дополнительные эффекты: флэнжер, pitch-shifter, speaker simulator, гармонайзер, подавитель шумов, эквалайзер и другие. Если синтезируется нескольких одновременно звучащих нот разных музыкальных инструментов, то большинство описанных операций в мощных цифровых устройствах выполняется для каждой ноты каждого инструмента отдельно. Результирующий сигнал получается суммированием в цифровом виде всех составляющих звуков и только после этого преобразуется из цифрового представления в аналоговое с помощью высококачественного ЦАП. Естественно, в конкретных реализациях цифровых синтезаторов музыкальных звуков некоторые этапы могут быть упрощенны или вовсе отсутствовать, что, конечно, не улучшает качество их звука. Обычно синтезаторы получают в среде музыкантов упрощенное название по типу примененного в них генератора возбуждающей функции. Например, если применяется волновой табличный ген