Реферат: Кодеры речи

Увеличение производительности приводит к увеличению стоимости и большим затратам энергии. Энерге­тические затраты важны для прило­жений в портативной аппаратуре, так как при больших затратах энергии со­кращается время между подзарядками батарей или возникает необходимость использовать батареи большей емко­сти, что, в свою очередь, приводит к большей цене и весу.

При синтезе и исследовании по­лосных вокодеров и полосных вокоде­ров с ЛПК используются различные модели речевого процесса. Наиболее точная модель речи представляет со­бой нестационарный случайный про­цесс с медленно меняющейся дисперси­ей и спектральной плотностью. При использовании подобной модели мож­но получить наиболее точный резуль­тат оценки качества вокодера.

Ортогональные вокодеры

Речевой сигнал можно промо­делировать откликом на возбуждаю­щий сигнал линейной системы с им­пульсной характеристикой с пере­менными параметрами, так что выход­ной сигнал равен свертке возбу­ждающего сигнала и импульсного от­клика голосового тракта при условии, что форма голосового тракта неизмен­на.

Все разнообразие звуков получа­ется путем изменения формы голосо­вого тракта. Если форма голосового тракта изменяется медленно, то на ко­ротких временных интервалах аппрок­симация выходного сигнала сверткой возбуждающего сигнала и импульсно­го отклика голосового тракта справед­лива. Если на коротком отрезке вре­мени входной сигнал является перио­дическим, с постоянной входной часто­той, то выходной сигнал также являет­ся периодическим. Такая модель спра­ведлива для описания звонких звуков. Аналогично временному, преобразова­ние речи может быть описано в частот­ной области, поскольку преобразова­ние Фурье речевого сигнала равно про­изведению преобразований Фурье воз­буждающего сигнала и импульсного отклика голосового тракта.

Частотная характеристика голо­сового тракта является гладкой функ­цией частоты и характеризуется аку­стическими резонансами, называемы­ми формантными частотами.

Поскольку при изменении различ­ных звуков форма голосового тракта изменяется, то с течением времени бу­дет изменяться и огибающая спектра речевого сигнала. Так, в частности, при изменении периода сигнала, воз­буждающего звонкие звуки, частотный разнос между гармониками спектра бу­дет также изменяться.

Таким образом, для адекватного описания речевого сигнала надо не только знать вид его спектра, но и то, как он изменяется во времени.

Основным параметром речевого сигнала, возбуждающего звонкий звук, является разнос гармоник основно­го тона, а характеристики голосового тракта достаточно полно определяют­ся частотами формант.

Изложенное позволяет сделать вывод об удобстве частотного метода описания и преобразования речевых процессов на основе кратковременно­го спектрального анализа.

Рассмотрим основные принципы, положенные в основу построения орто­гональных вокодеров.

Запишем кратковременное пре­образование Фурье дискретизированного речевого процесса в виде

(2.1)

Здесь весовая функция, сдвига­емая во времени.

Соотношение (2.1) может быть пе­реписано в двух формах. Первая фор­ма имеет вид свертки

(2.2)

где – обозначает свертку.

Реализация (2.2) может быть представлена в виде рис. 2.2,а и озна­чает, что спектр речевого процесса со­ответствует свертке весовой функции с сигналом , промодулированным колебанием .

Другая форма записи (2.1) получается, если ее переписать в виде

(2.3)

Система (2.3) может быть реализована в виде, представленном на рис. 2.2,б и означает преобразование речевого сигнала полосовым фильтром центральной частотой ω и импульсной характеристикой .

Реализации, представленные на рис. 2.2,а,б, отличаются тем, что первом случае используется цифровой фильтр нижних частот с импульсной характеристикой , а во втором – полосовой фильтр, что удобно при параллельном измерении на нескольких частотах ω.

Используя алгоритмы БПФ, оценку кратковременного преобразования Фурье на равноотстоящих частотах можно записать в виде

(2.4)

где

Формулу (2.4) можно преобразовать к виду

где

(2.5)

можно рассматривать как характери­стику комплексного ПФ с центральной частотой .

К-во Просмотров: 447
Бесплатно скачать Реферат: Кодеры речи