Реферат: Музыкальные возможности ПК
Наиболее распространенный сейчас метод синтеза музыкальных звуков - таблично-волновой (wave table - WT). Он заключается в записи характерных фрагментов звучания реальных инструментов - начального и среднего по времени всего звучания ноты - и использования их для синтеза всех прочих звуков, издаваемых этими инструментами. Записанные фрагменты образуют основной тембр инструмента, а различные приемы обработки в реальном времени - изменение частоты, амплитуды, добавление гармоник или их фильтрация - придают тембру оттенки и динамику, свойственные различным приемам игры. Для повышения достоверности имитации берется больше образцов (англ. samples) звучания и выполняется больше работы по их обработке во время синтеза; в простейшем случае таблично-волновой метод вырождается в так называемый сэмплерный, при котором звучание инструмента записывается и воспроизводится целиком от начала до конца. Пионером в реализации WT-синтеза стала в 1984 году фирма Ensoning. Вскоре WT-синтезаторы стали производить такие известные фирмы, как Emu, Korg, Roland и Yamaha.
В качестве образцов звучаний в таблично-волновом и сэмплерном методах могут использоваться и результаты других методов синтеза или обработки. Например, многие модные сейчас "электронные" звучания получены путем сложной обработки различных ударных звуков, звука падения капель и даже скрежета ржавого железа. Путем намеренного огрубления, внесения искажений и дополнительных призвуков изначально мягкие звуки делаются более резкими и пронзительными (яркий пример - дисторшн или овердрайв для гитары), а изначально звонкие и яркие - смягчаются и выравниваются. При помощи даже сравнительно простых операций вроде суммирования сигналов с фазовым сдвигом можно получать совершенно не похожие на оригиналы звуки.
В последнее время все большее число звуковых адаптеров оснащается таблично-волновыми синтезаторами, возможности которых приближаются к профессиональным синтезаторам, используемым на музыкальной сцене. Все они содержат заранее заданный стандартный набор звуков мелодических и ударных инструментов, что позволяет им более-менее похоже исполнять одни и те же музыкальные произведения в нотной форме, а некоторые вдобавок позволяют использовать дополнительные - готовые или самостоятельно созданные - наборы звуков. Все синтезаторы предоставляют возможности по управлению артикуляцией, амплитудной и частотной модуляцией звучания, а наиболее развитые позволяют "на ходу" в широких пределах менять спектр звука, создавать эффекты реверберации, хорового звучания, вращения звука и т.п.
Управляются компьютерные синтезаторы, как и их "старшие братья", при помощи специального музыкального цифрового интерфейса MIDI. Внутри компьютера он представляет собой просто расширение нотной системы записи музыки с дополнительными командами для управления ее исполнением; вдобавок к этому большинство звуковых адаптеров содержит внешний MIDI-интерфейс, к которому можно подключить любое количество клавишных или модульных музыкальных синтезаторов, блоков обработки звука, датчиков, систем освещения и т.п. Компьютер в этом случае выступает в роли "мозгового центра", управляющего всем этим электронным зверинцем - как дома или на дискотеке, так и в профессиональной музыкальной, театральной студии или в концертном зале. В этих областях персональные компьютеры обосновались так же давно и прочно, как в лабораториях математиков и физиков; но самое главное состоит в том, что многие вещи, которые еще недавно были возможны лишь на очень сложной и дорогой аппаратуре, становятся доступны каждому, у кого есть современный персональный компьютер со звуковым адаптером - даже самым простым и дешевым. Достаточно научиться его правильно применять - и для вас уже не будет ничего принципиально невозможного в мире звука.
2. ВАЖНЕЙШИЕ ПАРАМЕТРЫ ЗВУКОВЫХ КАРТ
2.1. Обзор
Для получения приемлемого качества записи компьютерной музыки необходимо пользоваться аппаратурой, способной его обеспечить. Число различных моделей звуковых карт составляет несколько десятков. А если учитывать еще и различные версии одних и тех же устройств, то при покупке карты приходится выбирать почти из сотни наименований. Не всякая звуковая карта способна на большее, чем озвучивание компьютерных игр. Конечно, принадлежность звуковой карты к продукции известных фирм является веской причиной того, что именно ее следует выбрать, это скажется в дальнейшем на надежности работы. К важнейшим параметрам относятся, в первую очередь:
> метод синтеза музыкальных звуков, реализованный в синтезаторе звуковой карты;
> разрядность АЦП/ЦАП звуковой карты;
> диапазон частот дискретизации;
> отношение сигнал/шум;
> динамический диапазон.
В современных звуковых картах по-прежнему применяется частотный синтез звуков (FM-синтез), но это делается в основном в целях обеспечения поддержки старых игр. Основным методом синтеза в настоящее время является волновой метод, или, как его еще называют, метод волновых таблиц (WT-синтез).
После первого же сравнения звучания MIDI-инструментов в FM и WT вариантах можно решить для себя, что FM-инструменты не стоят того, чтобы тратить на них время. Поэтому дальше речь пойдет только о WT-синтезаторах звуковых карт.
2.2. Разрядность звуковой карты
Разрядность звуковой карты существенно влияет на качество звука. Однако перед тем как перейти к более детальному обсуждению этого вопроса, следует пояснить, что речь идет о разрядности АЦП и ЦАП. Звуковые карты двойного назначения имеют в своем составе одновременно два функционально независимых узла: WT-синтезатор и устройство оцифровки звуковых сигналов, поступающих с внешнего источника. В каждый из узлов входит как минимум по одному ЦАП. В устройстве оцифровки, кроме того, имеется АЦП. В недавнем прошлом прямое указание на разрядность звуковой карты содержалось в ее названии в виде числа 16. Тем самым изготовители подчеркивали, что в их продукции качество цифрового звука как бы соответствует качеству звука лазерного проигрывателя, а не какой-нибудь там 8-битной карты. В дальнейшем 16 разрядов в ЦАП/АЦП стали нормой, а числа «32» или «64» в названиях стали означать совсем другое — максимальное количество одновременно звучащих голосов синтезатора звуковой карты (полифонию).
Некоторые высококачественные звуковые карты оборудованы 18-битными и даже 24-битными ЦАП/АЦП. Звуковые редакторы, работая с любыми звуковыми картами, в том числе и 16-битными, в процессе преобразований отсчетов сигнала используют арифметику с разрядностью двоичного представления числа, превышающей 16. Это позволяет уменьшить погрешность, накапливающуюся в процессе выполнения сложных алгоритмов обработки, которая в противном случае проявлялась бы как искажение звука.
Почему же столь важно наличие большого числа разрядов в устройствах ЦАП и АЦП? Дело заключается в том, что непрерывный (аналоговый) сигнал преобразуется в цифровой с некоторой погрешностью. Эта погрешность тем больше, чем меньше уровней квантования сигнала, т. е. чем дальше отстоят друг от друга допустимые значения квантованного сигнала. Число уровней квантования, в свою очередь, зависит от разрядности АЦП/ЦАП. Погрешности, возникающие в результате замены аналогового сигнала рядом квантованных по уровню отсчетов, можно рассматривать как его искажения, вызванные воздействием помехи. Эту помеху принято образно называть шумом квантования. Шум квантования представляет собой разность соответствующих значений реального и квантованного по уровню сигналов.
В случае превышения сигналом значения самого верхнего уровня квантования («старшего» кванта), а так же в случае, когда значение сигнала оказывается меньше нижнего уровня квантования («младшего» кванта), т. е. при ограничении сигнала, возникают искажения, более заметные по сравнению с шумом квантования. Для исключения искажений этого типа динамические диапазоны сигнала и АЦП должны соответствовать друг другу: значения сигнала должны располагаться между уровнями, соответствующими младшему и старшему квантам.
При записи внешних источников звука это достигается с помощью регулировки их уровня, кроме того, применяется сжатие (компрессия) динамического диапазона, о которой речь пойдет ниже.
В звуковых редакторах существует операция нормализации амплитуды сигнала. После ее применения наименьшее значение сигнала станет равным верхнему уровню младшего кванта, а наибольшее — нижнему уровню старшего. Таким образом, от ограничения сигнал сверху и снизу будет защищен промежутками, шириной в один квант. Разумеется, если при записи уже имело место ограничение амплитуды, то нормализация не избавит сигнал от искажения.
Приемлемым считается 16-разрядное представление сигнала, являющееся в настоящее время стандартным для воспроизведения звука, записанного в цифровой форме. С точки зрения снижения уровня шумов квантования дальнейшее увеличение разрядности АЦП нецелесообразно, т. к. уровень шумов, возникших по другим причинам (тепловые шумы, а также импульсные помехи, генерируемые элементами схем компьютера и распространяющиеся либо по цепям питания, либо в виде электромагнитных волн), все равно оказывается значительно выше, чем —96дБ.
Однако увеличение разрядности АЦП обусловлено еще одним фактором — стремлением расширить его динамический диапазон. Динамический диапазон это максимальное и минимальное значения сигнала, который может быть преобразован в цифровую форму без искажения и потери информации. Минимальный сигнал не может быть меньше, чем напряжение, соответствующее одному кванту, а максимальный — не должен превышать величины напряжения, соответствующего N квантам. Поэтому динамический диапазон для 16-разрядного АЦП составляет 96 дБ, для 18-разрядного— 108 дБ, для 20-разрядного— 120 дБ. Иными словами, для записи звучания некоторого источника звука, динамический диапазон которого составляет 120 дБ, требуется двадцатиразрядный АЦП. Если такого нет, а имеется только шестнадцатиразрядный, то динамический диапазон звука должен быть сжат на 24 дБ: со 120 дБ до 96 дБ.
В принципе, существуют методы и устройства сжатия (компрессии) динамического диапазона звука. Но то, что они проделывают со звуком, как ни смягчай формулировки, все равно искажает его. Именно поэтому так важно для оцифровки звука использовать АЦП, имеющий максимальное количество разрядов. Владелец 16-битной звуковой карты может убедиться в отсутствии особых причин для расстройства: динамические диапазоны большинства источников звука вполне соответствуют динамическому диапазону такой звуковой карты. Кроме того, 18-битное или 20-битное представление сигнала применяется только на этапе обработки звука. Конечная аудиопродукция (CD и DAT) реализуется в 16-битном формате.
После того как мы немного разобрались с разрядностью звуковой карты, пришло время поговорить о частоте дискретизации.
2.3. Частота дискретизации
В процессе работы АЦП происходит не только квантование сигнала по уровню, но и его дискретизация во времени. Сигнал, непрерывно изменяющийся во времени, заменяют рядом отсчетов этого сигнала. Обычно отсчеты сигнала берутся через одинаковые промежутки времени. Интуитивно ясно, что если отсчеты отстоят друг от друга на слишком большие интервалы, то при дискретизации может произойти потеря информации: если важные изменения сигнала произойдут не в те моменты, когда были взяты отсчеты, они могут быть «пропущены» преобразователем. Получается, что отсчеты следует брать с максимальной частотой. Естественным пределом служит быстродействие преобразователя. Кроме того, чем больше отсчетов приходится на единицу времени, тем больший размер памяти необходим для хранения информации.
Проблема отыскания разумного компромисса между частотой взятия отсчетов сигнала и расходованием ресурсов трактов преобразования и передачи информации возникла задолго до того, как на свет появились первые звуковые карты. В результате исследований было сформулировано правило, которое в отечественной научно-технической литературе принято называть теоремой Котельникова [Котельников В.А. Теория потенциальной помехоустойчивости.— М., Госэнергоиздат, 1956].
Если поставить перед собой задачу обойтись без формул и использования серьезных научных терминов типа «система ортогональных функций», то суть теоремы Котельникова можно объяснить следующим образом. Сигнал, представленный последовательностью дискретных отсчетов, можно вновь преобразовать в исходный (непрерывный) вид без потери информации только в том случае, если интервал между соседними отсчетами не превышает половины периода самого высокочастотного колебания, содержащегося в спектре сигнала.
Из сказанного следует, что восстановить без искажений можно только сигнал, спектр которого ограничен некоторой частотой F. Теоретически все реальные сигналы имеют бесконечные спектры. Для того чтобы при дискретизации избежать искажений, вызванных этим обстоятельством, сигнал вначале пропускают через фильтр, подавляющий в нем все частоты, которые превышают заданное значение Fmax и лишь затем производят дискретизацию. Согласно теореме Котельникова частота, с которой следует брать отсчеты, составляет Fд = 2Fmax Теорема получена для идеализированных условий. Если учесть некоторые реальные свойства сигналов и устройств преобразования, то частоту дискретизации следует выбирать с некоторым запасом по сравнению со значением, полученным из предыдущего выражения.