Компьютерное представление звуковой информации

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование

·воляет экономить на наименее значимых с точки зрения восприятия человека деталях звучания. Приемы, применяемые в MP3, сложны и опираются на достаточно сложную математику, но зато обеспечивают очень значительный эффект сжатия звуковой информации. Технология MP3 является, пожалуй, самой во многих бытовых звуковых устройствах, например, плеерах и сотовых телефонах.

Формат MIDI. Название MIDI есть сокращение от Musical Instrument Digital Interface, т.е. цифровой интерфейс для музыкальных инструментов. Это довольно старый (1983 г.) стандарт, объединяющий разнообразное музыкальное оборудование (синтезаторы, ударные и т.д.). MIDI базируется на пакетах данных, каждый из которых соответствует некоторому событию, в частности, нажатию клавиши или установке режима звучания. Любое событие может одновременно управлять несколькими каналами, каждый из которых относится к определенному оборудованию. Несмотря на свое изначальное предназначение, формат файла стал стандартным для музыкальных данных, которые при желании можно проигрывать с помощью звуковой карты компьютера безо всякого внешнего MIDI-оборудования. Главным преимуществом файлов MIDI является их очень небольшой размер, поскольку это не детальная запись звука, а фактически некоторый расширенный электронный эквивалент традиционной нотной записи. Но это же свойство одновременно является и недостатком: поскольку звук не детализирован, то разное оборудование будет воспроизводить его по-разному, что в принципе может даже заметно исказить изначальный музыкальный замысел.

Формат MOD. Представляет собой дальнейшее развитие идеологии MIDI-файлов. Известные как модули программ воспроизведения, они хранят в себе не только электронные ноты, но и образцы оцифрованного звука, которые используются как шаблоны индивидуальных нот. Таким способом достигается однозначность воспроизведения звука. К недостаткам формата следует отнести большие затраты времени при наложении друг на друга шаблонов одновременно звучащих нот.

 

Цифровые синтезаторы музыкальных звуков

 

Информация, которую несет музыкальный звук, рассказывает о высоте (то есть о том, какая нота звучит) и тембре или типе музыкального инструмента, с помощью которого производится звукоизвлечение (генерация звука). Так же, в структуру музыкального звука исполнитель закладывает свою "импрессию", варьируя силу и резкость начала (атаки) и окончания (затухания), громкость, применяя амплитудное и частотное вибрато. Осциллограмма сигнала музыкального инструмента представлена на рис.2.

 

 

 

 

 

 

 

 

 

 

 

рис. 2

 

Как правило, звук начинается с так называемой атаки, быстрого нарастания амплитуды сигнала. Длительность атаки для разных музыкальных инструментов варьируется от единиц до нескольких десятков или даже сотен миллисекунд. После атаки начинается поддержка, в течение которой уровень сигнала примерно постоянен или плавно меняется в случае применения амплитудного вибрато. Во время поддержки формируется ощущение высоты звука. Далее идет участок затухания, уменьшения величины сигнала. Атака, поддержка и затухание образуют так называемую амплитудную огибающую.

Спектр сигнала, то есть представление сигнала в частотной области, показан на рис. 3.

 

 

 

 

 

 

 

 

рис. 3

 

 

Спектр музыкального сигнала состоит из последовательности (по оси частот) узких "колоколов". Причем частоты, соответствующие максимумам (вершинам) "колоколов", примерно кратны основному тону или "фундаментальной" частоте музыкального звукового сигнала, под которой понимается частота, соответствующая человеческому ощущению высоты звука.

 

Анализ музыкальных инструментов

 

Целью анализа музыкальных звуков является изучение их структуры, определение существенных для восприятия человеческим слухом характеристик и использование полученных знаний для синтеза правдоподобно звучащих виртуальных цифровых музыкальных инструментов.

Традиционно для анализа сигналов в частотной области применяется быстрое преобразование Фурье. Данное преобразование позволяет представить любой дискретизированный сигнал, состоящий из N отсчетов в виде суммы N гармонических колебаний вида:

 

Yk(t)=Ak*sin(2П*Fk*t+Фk),

 

где k - номер гармоники, целое число от 0 до N-1; Ak - амплитуда k-й гармоники (расположенные на графике в виде вертикальных линий, как на рис. 3, в порядке возрастания k, они и образуют амплитудный спектр сигнала); Fk - частота k-й гармоники; Фk - фаза k-й гармоники; t - время, равное в моменты дискретизации (взятия отсчетов) сигнала

=i*Td,

 

где i - номер дискретного отсчета сигнала от 0 до N-1; Td - период дискретизации сигнала (интервал времени, через который берутся отсчеты сигнала). Td = 1/Fd, где Fd - частота дискретизации (например, 44,1 кГц). Fk - частота k-й гармоники, вычисляемая по формуле

звуковой электромузыкальный синтезатор цифровой

Fk=k*Fd/N.

 

Другими словами, Fk = k*F1. Такое же соотношение существует между гармониками (в смысле координат вершин "колоколов") в спектре музыкального сигнала. Таким образом получается, что даже спектр белого шума ( стационарный шум, спектральные составляющие которого равномерно распределены по всему диапазону задействованных частот), вычисленный с помощью БПФ, состоит из суммы "гармонических" гармоник. В данном случае над прин?/p>