Научная визуализация

Scientific Visualization

Электронный журнал открытого доступа

 Национальный Исследовательский Ядерный Университет "МИФИ"

      ISSN 2079-3537      

 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                                                                                             
Научная визуализация
Год выпуска: 2013
Квартал: 3
Том: 5
Номер: 3
Страницы: 75 - 88
Название публикации: ТЕХНОЛОГИИ ОБРАЗНОГО АНАЛИЗА В ЗАДАЧАХ ЦИФРОВОЙ ОБРАБОТКИ РЕЧЕВОЙ ИНФОРМАЦИИ
Авторы: В. Алюшин (Россия), С. Дворянкин (Россия)
Адреса авторов: В. Алюшин
AVictor2007@yandex.ru
Национальный исследовательский ядерный университет «МИФИ», Москва, Россия
 
С. Дворянкин
svdvoryankin@mephi.ru
Национальный исследовательский ядерный университет «МИФИ», Москва, Россия
Краткое описание: Данная работа посвящена исследованию возможностей образного анализа-синтеза изображений сонограмм речевых сигналов в различных областях применения: кодирование речи, нейтрализация помех и искажений, идентификация говорящего, компрессии речи и др. Описаны различные алгоритмы синтеза звуковых сигналов на основе заданного изображения сонограммы. Представлен сравнительный анализ качества различных алгоритмов синтеза на основе: всей сонограммы, локальных максимумов, кратных основному тону гармоник с оригинальной или синтезированной фазой. При анализе качества учитывались такие показатели, как время работы алгоритма и степень отличия между сонограммами исходного и синтезированного сигналов. Для количественной оценки степени отличия введено понятие нормы разности. Все описанные алгоритмы синтеза были реализованы в едином программном комплексе “SoundTool”, использующем технологию параллельного программирования NVidia Cuda для ускорения вычислений. Данный комплекс также позволяет осуществить редактирование сонограммы звукового сигнала, ее импорт или экспорт для редактирования в стандартных графических редакторах, а также проводить медианную фильтрацию для нейтрализации узкополосных помех, в частности, наводок от сети электропитания.
Язык: Русский