|
Научная визуализация
Год выпуска: | 2013 |
Квартал: | 3 |
Том: | 5 |
Номер: | 3 |
Страницы: | 75 - 88 |
|
Название публикации: |
ТЕХНОЛОГИИ ОБРАЗНОГО АНАЛИЗА В ЗАДАЧАХ ЦИФРОВОЙ ОБРАБОТКИ РЕЧЕВОЙ ИНФОРМАЦИИ |
Авторы: |
В. Алюшин (Россия), С. Дворянкин (Россия) |
Адреса авторов: |
В. Алюшин
AVictor2007@yandex.ru
Национальный исследовательский ядерный университет «МИФИ», Москва, Россия
С. Дворянкин
svdvoryankin@mephi.ru
Национальный исследовательский ядерный университет «МИФИ», Москва, Россия |
Краткое описание: |
Данная работа посвящена исследованию возможностей образного анализа-синтеза изображений сонограмм речевых сигналов в различных областях применения: кодирование речи, нейтрализация помех и искажений, идентификация говорящего, компрессии речи и др. Описаны различные алгоритмы синтеза звуковых сигналов на основе заданного изображения сонограммы. Представлен сравнительный анализ качества различных алгоритмов синтеза на основе: всей сонограммы, локальных максимумов, кратных основному тону гармоник с оригинальной или синтезированной фазой. При анализе качества учитывались такие показатели, как время работы алгоритма и степень отличия между сонограммами исходного и синтезированного сигналов. Для количественной оценки степени отличия введено понятие нормы разности. Все описанные алгоритмы синтеза были реализованы в едином программном комплексе “SoundTool”, использующем технологию параллельного программирования NVidia Cuda для ускорения вычислений. Данный комплекс также позволяет осуществить редактирование сонограммы звукового сигнала, ее импорт или экспорт для редактирования в стандартных графических редакторах, а также проводить медианную фильтрацию для нейтрализации узкополосных помех, в частности, наводок от сети электропитания. |
Язык: |
Русский |
|
|
|