Доклад: Аудио материалы
В этом окне можно задать минимальное расстояние между фразами (Minimuminter-phrasesilence). Все участки тишины, короче заданного значения вырезаны не будут.
Также присутствуют настройки порога атаки (attackthreshold) и порога отпускания (releasethreshold). Порог атаки задает тот уровень громкости, который программа будет считать началом новой фразы, а порог отпускания – это уровень громкости, который программа будет считать концом фразы и начала паузы.
Рис. 3.5
Частотная обработка
Для частотной обработки обычно применяется эквалайзер. Эквалайзер – это устройство или программное средство, позволяющее раздельно управлять громкостью частот в различных диапазонах сигнала. В SoundForge эквалайзер представлен в трех вариантах: графический, параграфический и параметрический.
На рисунке 3.6 показано окно графического эквалайзера. Усиливать или ослаблять частоты можно с помощью смещения точек на кривой выше уровня нуля или ниже. Также графический эквалайзер обладает вкладками 10 Band и 20 Band, которые имитируют аппаратные эквалайзеры.
Рис. 3.6
Параметрический эквалайзер является более мощным и гибким, чем графический эквалайзер. Окно параметрического эквалайзера приведено на рисунке 3.7.
Рис. 3.7
Основное отличие этого эквалайзера от графического – возможность более точного задания частоты и уровня громкости сигнала этой частоты.
Параграфический эквалайзер, в отличии от графического и параметрического, позволяет получить более сложный – нелинейный график коррекции звука. Окно параграфического эквалайзера приведено на рисунке 3.8.
Рис. 3.8
В распоряжении пользователя находятся четыре частотных диапазона, у каждого из которых своя регулировка уровня (четыре вертикальных движка в середине окна под графиком).
Для каждого диапазона можно указать, где он расположен на шкале частот. Эта операция производится с помощью горизонтальных движков Centerfrequency (частота середины диапазона). Также можно регулировать ширину диапазона.
Для работ, связанных с частотной обработкой фонограммы дикторского текста наиболее удобно использовать графический эквалайзер. Параметрический и параграфический эквалайзеры используются для проведения более сложных работ, связанных с частотной обработкой.
Выравнивание уровня громкости
Также как и частотную обработку, выравнивание уровня громкости необходимо производить при издании нескольких фонограмм в рамках одного мультимедиа продукта. Это необходимо для комфортного прослушивания.
В качестве функции для выравнивания уровня громкости удобно использовать Normalize. Эта функция увеличивает громкость звука следующим образом: сначала исследует файл на предмет самого высокого уровня сигнала, а потом вычитает этот уровень из максимально возможного, который равен 100% (или установленному значению). Функция Normalize использует получившуюся разность при увеличении громкости звуковых данных. Самый высокий уровень сигнала в данном файле доводится до 100% (или до установленного значения), а более низкие уровни пропорционально увеличиваются.
Контрольное прослушивание и сохранение аудио файла
Перед сохранением окончательной версии фонограммы, ее необходимо прослушать. В случае выявления дефектов или несоответствия требованиям технического задания, выявленные недостатки необходимо устранить. После устранения брака, производится повторное контрольное прослушивание.
Если фонограмма соответствует требованиям технического задания, выполняется последний этап обработки – сохранение файла. Для возможности изменения обработки полученного файла в будущем, необходимо сохранить его не только в выходном формате (формат, указанный в техническом задании), но и без компрессии (MicrosoftWAVE, PCM (Uncompressed), 16 bit, 44.1 kHz, mono/stereo).
Таблица основных уровней качества звуковых файлов, создаваемых для использования в каналах связи.
kBit/s | Частота дискретизации при обработке сигнала | kbps | Реальная выходная частота | Описание |
256 | 44 kHz, stereo | 32 | 22 кГц | Максимальные возможности mp3 формата - звук чистый и без искажений. Но и максимальный поток (32 кбайта в секунду), что скажется на чуть большем размере файла mp3 и DivX и возможно небольшом замедлении на слабых компьютерах при воспроизведении. |
128 | 44 kHz, stereo | 16 | 18 кГц | Оптимальные возможности mp3 формата - звук с минимумом искажений. Средний поток - 16 кбайт. Наиболее часто используемый битрэйт при формировании mp3. |
96 | 44 kHz, stereo | 12 | 16 кГц | Средние возможности mp3 формата - звук еще нормальный, но могут быть искажения и уже нет высоких частот. Часто используемый битрэйт, хотя выигрыш в конечном размере файла по сравнению с предыдущим форматом небольшой, а искажений существенно больше. |
64 | 44 kHz, mono | 8 | 18 кГц | Это моно аналог варианта 128 кбит. Оптимальные возможности mp3 формата для моно звука - звук с минимумом искажений, но моно. Часто используемый битрэйт в случаях, когда не требуется стереозвука. |
48 | 44 kHz, mono | 6 | 16 кГц | Не очень качественный звук для музыкальных файлов, могут быть искажения и уже нет высоких частот, причем моно. |
64 | 22 kHz, stereo | 8 | 11 кГц | Оптимальные возможности mp3 формата для дикторского сопровождения - звук может быть с небольшими искажениями, высоких мало. |
32 | 22 kHz, mono | 4 | 11 кГц | Оптимальные возможности mp3 формата для дикторского сопровождения - звук может быть с небольшими искажениями, высоких мало, но хорошие средние. Минимальный битрэйт (4кбайта в секунду). |