Мел-частотные кепстральные коэффициенты
В системах распознавания по голосу данный метод считается одним из самых популярных. Суть метода заключается в следующем:
1. Подача последовательности отсчетов определенной части сигнала, которая исследуется на итерации x0,....,xN-1.
2. Применение весовой функции для уменьшения искажений. Чаще всего в качестве весовой функции используют окно Хэмминга:

где - размер окна в отсчетах.
3. Дискретное преобразование Фурье:

где соответствует частотам
,
где является частотой дискретизация.
4. Далее с помощью треугольных фильтров идет разбиение на диапазоны. Границы этих фильтров рассчитываются в шкале мел. Мел - единица высоты звука, основанная на восприятии этого звука нашими ушами. Формула для перевода в мел-частотную область:
.
Формула обратного преобразования:
.
Чаще всего используют 24 фильтра. Количество фильтров обозначим как . Фильтры применяются к квадратам модулей коэффициентов преобразования Фурье, а затем высчитывается логарифм:

где - весовые коэффициенты фильтров, которые были получены.
5. Дискретное косинусное преобразование является последним этапом данного метода. На этой стадии происходит вычисление мел-частотных кепстральных коэффициентов (MFCC):

Коэффициент - энергия сигнала, поэтому он не используется. Количество мел-частотных кепстральных коэффициентов на практике равняется порядка 12.
Date: 2016-06-06; view: 1926; Нарушение авторских прав Понравилась страница? Лайкни для друзей: |
|
|