Реферат: Кодирование речи методом RPE/LPC -LTP

Взвешивающий фильтр с передаточной функцией

используется для корректировки формантных областей в спектре остатка предсказания относительно уровня шума квантования. Осуществляется это путем выбора g.

Оптимальное значение g определено путем прослушивания. Оно оказалось равным 0,7 … 0,9.

При этом воспринимаемое значение шума квантования становится минимальным.

Длительность импульсной характеристики составляет 11 выборок, при частоте дискретизации 8 кГц. Значения импульсной характеристики для соответствующих выборок с индексом представлены в таблице 1.

Таблица 1 Значения импульсной характеристики

6 5(=7) 4(=8)
1,000000 0,700790 0,250793
2(=9) 2(=10) 1(=11)
0,000000 -0,045649 -0,016356

Выход взвешивающего фильтра для каждого субкадра, длительностью 5 мс является , где номер выборки сигнала в субкадре с частотой дискретизации 8 кГц.

В соответствии с RPE алгоритмом, для уменьшения количества передаваемых дискретных отсчетов процесса, он подвергается предварительной обработке.

Дискретизированные с частотой 8 кГц отсчеты речи разбиваются на кадры, длительностью 20 мс, и 4 субкадра по 5 мс.

Субкадры процесса на выходе НЧ фильтра, длительностью 5 мс и состоящие из 39 отсчетов, подвергается децимации (прореживанию) в соотношении 1:3.

В результате получаются три выборки по 13 импульсов в каждой. Фазы этих последовательностей сдвинуты друг относительно друга на одну выборку (0,125 мс) (рисунок 2).

Далее производится выбор номера одной из этих трех последовательностей, обладающей с максимальной энергией, т. е.

В выбранной последовательности определяется импульс с максимальной амплитудой (масштабный) импульс .

В каждом 5 мс субкадре на передачу номера последовательности с максимальной энергией затрачивается 2 бита, а на передачу - 6 бит. кодируется по логарифмическому закону.

Кроме того, передаются амплитуды всех 13 импульсов выбранной последовательности с максимальной энергией.

При этом на передачу каждого импульса затрачивается 3 бита. На всю последовательность затрачивается бит в субкадре или бит в кадре.

Ниже приводится распределение битов по параметрам в 20 мс кадре: 8 коэффициентов ; 4 коэффициента ; 4 коэффициента ; 4 коэффициента ; 4 значения ; 4 значения всех 13 импульсов . Итого 260 бит/кадр.


Рисунок 2. Пример децимации и селекции импульсов

При частоте кадров 50 Гц общая информационная скорость составляет кбит/с. Для синхронизации и защиты от ошибок в канале связи отводится 3 кбит/с.

Кодер RPE-LTP-LPC обеспечивает высокое качество речи, которое незначительно снижается при 5% ошибок в канале связи и при отношениях сигнал/помеха 26 и 18 дБ.

Кодер может быть реализован на одном цифровом процессоре типа TMS320C25 с внешней памятью.

2. Структура декодера речи в стандарте GSM

Структурная схема декодера речи в стандарте GSM представлена на рисунке 3.

Рисунок 3. Структурная схема декодера речи стандарта GSM

Рассмотрим кратко структуру и работу декодера – синтезатора речи показанного на рисунке 3.

Из канала связи данные с помощью демультиплексора распределяются по различным блокам декодера. На RPE декодер поступают номер последовательности , максимальное значение импульса выборки, представляющей собой прореженный остаток предсказания.

Здесь отсчеты выборки масштабируются и дополняются нулями. Восстановленная таким образом выборка подается на LTP – синтезатор.

К-во Просмотров: 265
Бесплатно скачать Реферат: Кодирование речи методом RPE/LPC -LTP