Реферат: Кодеры речи

на всех выходах гребенки ПФ так, что

(2.6)

Формула (2.4) является осно­вополагающим уравнением анализа с кратковременным преобразованием Фурье, а формула (2.6) – основным уравнением синтезатора.

Гомоморфные вокодеры

В основе гомоморфных вокодеров лежит метод нелинейной (гомоморфной) фильтрации. Общая структу­ра гомоморфных систем, предназначенных для инверсной фильтрации речевых сообщений, представлена на рис. 2.4.

Свойства системы определяется соотношением , где и – Z-преобразования и соответственно.

Сигнал на выходе системы обычно называют комплексным кепстром. Система является линейной, а система – обратной к системе .

Удобства подобных преобразова­ний для анализа и синтеза рече­вых процессов обусловлены рядом свойств комплексного кепстра. В част­ности: комплексный спектр последова­тельностей, имеющих Z-преобразование, в основном сосредоточен вблизи нуля; последовательность, состоящая из равноотстоящих импульсов, имеет комплексный кепстр того же вида; для вычисления комплексного кепстра последовательности с мини­мальной фазой можно обойтись ло­гарифмом действительной, а не ком­плексной функции.

Выше было показано, что отрез­ки речевых сигналов могут быть пред­ставлены откликом линейной системы.

Так, в случае звонких звуков возбу­ждаемый сигнал имеет вид последова­тельности импульсов. В случае глу­хих звуков возбуждающий сигнал мо­жет быть смоделирован в виде шума.

Обычно предполагают, что пере­даточная функция линейной системы, имитирующей голосовой тракт, опи­сывается рациональной функцией Z. В результате, согласно перечисленным выше свойствам кепстра, комплексный кепстр импульсного отклика голосово­го тракта сосредоточен вблизи нуля.

В случае звонкого звука комплекс­ный кепстр возбуждающего сигнала состоит из импульсов, повторяющихся с периодом основного тона. То есть в случае звонкой речи комплексные кепстры возбуждающего сигнала и им­пульсного отклика голосового тракта занимают неперекрывающиеся времен­ные сигналы и могут быть извлечены из общего кепстра с помощью линей­ной системы L.

Механизм восстановления речево­го сигнала с помощью кепстров может быть пояснен следующим образом.

Поскольку спектр звонкого звука формируется умножением огибающей, характеризующей состояние голосово­го тракта, на функцию, описывающую тонкую структуру спектра возбужда­ющего сигнала, то логарифм спектра равен сумме логарифмов огибающей спектра и спектра возбуждающего сиг­нала.

Логарифм спектра возбуждающе­го сигнала изменяется с ростом часто­ты гораздо быстрее логарифма огиба­ющей спектра. Кроме того, он пери­одичен. В результате обратное пре­образование Фурье от логарифма оги­бающей спектра сконцентрировано по оси времени вблизи нуля, в то вре­мя как обратное преобразование от ло­гарифма спектра возбуждающего сиг­нала является линейчатым, отража­ющим его периодичность в частотной области.

Для выделения логарифма огиба­ющей спектра из полного спектра ло­гарифма его «взвешивают» окном, от­крытым только в начальном участке кепстра (вблизи нуля). Эту процедуру называют «сглаживанием кепстра».

В системе анализа-синтеза, осно­ванной на гомоморфной фильтрации, начальные значения кепстра служат параметрами, описывающими состоя­ние голосового тракта или огибающую спек

К-во Просмотров: 448
Бесплатно скачать Реферат: Кодеры речи