ВИЗУАЛИЗАЦИЯ МНОГОУРОВНЕВОГО ВЕЙВЛЕТ-АНАЛИЗА ФОНОГРАММ

Ю.Г. Горшков

Московский государственный технический университет имени Н.Э. Баумана, Москва, Россия

y.gorshkov@npo-echelon.ru

 

Содержание

1. Введение

2. Вейвлет-преобразование нестационарных сигналов

3. Используемое программное обеспечение

4. Обработка речевых сигналов с использованием вейвлет-преобразования

5. Заключение

Cписок литературы

 

Аннотация

Многоуровневый вейвлет-анализ сигналов позволяет решать задачи определения подлинности фонограмм, оценки эмоциональной напряженности диктора, получения акустической обстановки окружения с точностью, недоступной цифровой обработке на основе преобразования Фурье. Исследования, проведенные в МГТУ им. Н.Э. Баумана с использованием программного комплекса WaveView-VSA  показали, что вейвлет-сонограммы намного более информативны, чем обычные Фурье-спектрограммы и, в отличие от последних, позволяют легко выявлять тончайшие локальные особенности акустических сигналов. В статье рассмотрена технология получения вейвлет-сонограмм речи с высоким частотно-временным разрешением. Проведено сравнение частотно-временных характеристик сонограмм звуков речи, полученных  с использованием преобразования Фурье и многоуровневого вейвлет-преобразования. Представлены результаты фоноскопических исследований аудиозаписей при решении задач определения подлинности фонограмм и оценке эмоциональной напряженности диктора. Приводятся примеры сонограмм сигналов акустической обстановки.

 

Ключевые слова: речевой сигнал, многоуровневый вейвлет-анализ, сонограмма, подлинность фонограммы, эмоциональная напряженность, акустическая обстановка.

 

1. Введение

 

В настоящее время метод научной визуализации широко применяется экспертами-фоноскопистами при проведении  инструментального исследования аудиозаписей. Наибольшее практическое применение при проведении криминалистического исследования фонограмм находят комплексы «ИкарЛаб» [1], «Justiphone» [2], «ОТЕxpert» [3], разработанные российскими компаниями. Принятие решения при идентификации личности по голосу в перечисленных средствах основывается на визуализации и оценке спектральных характеристик гласных звуков, полученных на основе преобразования Фурье или быстрого преобразования Фурье (БПФ). На этапе предварительного анализа фонограмм используются звуковые редакторы: Adobe Audition, AWave, Cool Edit, Sound Forge, Speech Analyzer, Steinberg WaveLab, Wave Flow, WaveLab, в которых частотно-временные представления речевого сигнала - сонограммы или динамические спектрограммы также строятся с использованием алгоритмов БПФ [11].

Речевые сигналы являются по своей природе нестационарными. Анализ их, как правило, заключается в исследовании изменения частотно-временных характеристик сигнала. До недавнего времени ведущую роль в анализе нестационарных процессов играло преобразование Фурье. Однако ситуация изменилась с появлением работ, описывающих вейвлет-преобразования и их применение. В последние годы семейство анализаторов, названных вейвлетами, широко применяется в задачах анализа временных сигналов, распознавания образов и синтеза изображений.

Популярность анализа различных процессов методами на основе вейвлет-преобразования обуславливается тем, что в отличие от преобразования Фурье, которые отражают только частотные характеристики исследуемого сигнала, вейвлет-преобразования позволяют описывать частотно-временные свойства, выполняя функцию «математического микроскопа» [4].

 

2. Вейвлет-преобразование нестационарных сигналов

 

Вейвлет-преобразование - это разложение сигнала по базису, сконструированному из обладающей определенными свойствами солитоноподобной функции (вейвлета) посредством масштабных изменений и переносов. Каждая из функций этого базиса характеризует как определенную пространственную или временную частоту, так и ее локализацию в физическом пространстве или времени. В то время как, например, преобразование Фурье допускает только частотную локализацию [5].

Для сравнения на рисунке 1 показана локализация в частотно-временном пространстве преобразований с анализирующей функцией преобразования Фурье. Из рисунка видно, что преобразование Фурье хорошо локализует частоту, но без временного разрешения; вейвлет-преобразование имеет подвижное окно, локализованное около выбранного момента времени, расширяющееся с ростом масштаба, что и является наиболее желательным при получении точной спектральной информации [4].

 

Рис. 1. Частотно-временная локализация преобразований с разными анализаторами: а) вейвлеты, б) гармоники Фурье

 

Применение вейвлетов в задачах обработки и распознавания речи продиктовано особенностями речевого акустического сигнала. Вейвлеты, как средство многомасштабного анализа позволяют выделять, одновременно как основные характеристики сигнала, так и короткоживущие высокочастотные явления в речевом сигнале. Это свойство является существенным преимуществом в задачах обработки речевого сигнала по сравнению с оконным преобразованием Фурье, где, варьируя ширину окна, приходится выбирать масштаб явлений, которые необходимо выделить в сигнале. Кроме того, известно, что человеческое ухо устроено так, что при обработке звукового сигнала, оно передает мозгу его вейвлет-образ. Колебания амплитуды давления передаются от барабанных перепонок на мембрану и далее распространяются по всей длине завитка внутреннего уха. Завиток скручен в виде спирали во внутреннем ухе. Если представить, что завиток распрямлён в некоторый сегмент, а вместе с ним и распрямлена мембрана, то можно показать, что результирующее преобразование сигнала будет с точностью до константы совпадать с вейвлет-преобразованием [6].

Вейвлет-преобразованием функции f(t) называется функция двух переменных:

      

                                       (1)

где ψ(t) – вейвлет, а – масштабный коэффициент, b – параметр сдвига.

Вейвлеты создаются с помощью специальных базовых функций – прототипов, задающих их вид и свойства и удовлетворяющих ряду условий [4]:

1. Локализация. Вейвлет-преобразование, в отличие от преобразования Фурье, использует локализованную базисную функцию. Вейвлет должен быль локализован как во временной, так и в частотной областях.

2. Нулевое среднее. .

3. Ограниченность. .

При вейвлет-преобразовании выбор типов вейвлетов намного более обширен, чем при преобразовании Фурье. Кроме того, в качестве вейвлет-функций могут использоваться ортогональные и биортогональные непериодические функции.

 

 Выбор материнского вейвлета

 Выбор вида вейвлета для проведения анализа является одним из важнейших решений, которое должен учитывать исследователь. Общим правилом здесь является то, что вид вейвлета должен быть похож на форму анализируемого сигнала. На рисунках 2 − 4 представлены виды некоторых вейвлетов.

 

Рис. 2. Антисимметричный вейвлет

Рис. 3. Вейвлет «Мексиканская шляпа»

Рис. 4. Вейвлет Морле

 

В качестве материнского вейвлета при получении частотно-временного представления речевого сигнала - сонограмм выбран вейвлет Морле. К преимуществам данного вейвлета относится то, что он задается точной функцией времени. При использовании вейвлета Морле можно, задавая коэффициент масштабирования, изменять его локализацию и достигать высокого частотно-временного разрешения сонограмм или изображений «видимый» звук.

Вейвлет Морле имеет вид:

    (2)

Применение вейвлета Морле целесообразно при анализе сигналов с частотой дискретизации 8 кГц, либо сигналов, подвергнутых компрессии. Вейвлет Морле – исторически первая функция, получившая название вейвлета. Хотя дискретные функции (вейвлеты) Хаара были изучены гораздо раньше вейвлетов Морле, только с работы Морле началось изучение этих функций в контексте частотно-временного анализа.

Вейвлет-анализ выполняется следующим образом:

1. Выбирается начальный масштаб вейвлета (обычно равный 1).

2. Вейвлет сдвигается вдоль всего сигнала, и на каждом шаге его огибающая сравнивается с огибающей сигнала. В результате этой процедуры получается одна строка коэффициентов частотно-временной области, соответствующая некоторой частоте.

3. Вейвлет растягивается или сжимается вдоль временной оси и процесс повторяется. 

 

3. Используемое программное обеспечение

 

Программное обеспечение комплекса WaveView-VSA является высокоточным средством фоноскопического исследования аудиозаписей с использованием технологии многоуровневого вейвлет-анализа. В нем реализовано несколько алгоритмов построения вейвлет-сонограмм, выполнения вейвлет-фильтрации, вычисления фазы сигнала, а также получения биометрических параметров, характеризующих эмоциональную напряженность диктора [7]. Цифровая сонограмма – это диаграмма, на которой по оси абсцисс откладывается время, по оси ординат – частота, а амплитуда соответствующей частотной составляющей отмечается интенсивностью цвета в данной точке графика. При построении сонограммы для каждого момента времени необходимо вычислять значения спектра сигнала. Полученные значения амплитуд и есть значения одного столбца графика. Сонограмма является более информативной при исследовании речевого сигнала, чем спектрограмма.

Описание главного меню

На рисунке 5 представлен  вид главного меню настроек построения вейвлет-сонограммы.

 

Рис. 5. Вид главного меню настроек построения вейвлет-сонограммы

 

Предусмотрены следующие режимы обработки и задания параметров.

 

  1. «Преобразование» – выбор материнского вейвлета и отображаемой на экране компоненты вейвлет-преобразования (амплитуда, фаза).
  2. «Коэффициент масштабирования» – параметр, указывающий степень локализации вейвлет-сонограммы по частоте и по времени. Малые значения дают высокую локализацию по времени, но низкую – по частоте. Большие значения – наоборот. Зависимость степени и локализации от коэффициента масштабирования для каждого материнского вейвлета своя.
  3. «Верхняя частота»/«нижняя частота» -  диапазон частот, в котором будет построена вейвлет-сонограмма. Для установки верхней частоты: «22k», «11k», «5.5k» и «4k» соответствуют: 22050 Гц, 11025 Гц, 5500 Гц и 4000 Гц.
  4. «Степень детализации» – показатель уровня частотно-временного разрешения вейвлет-сонограммы. «Цветовая палитра» – выбор цветового представления  вейвлет-сонограммы. 
  5. «Частотная шкала»– может быть представлена в логарифмическом либо линейном масштабе. «Логарифмическая» дает  детальное представление низкочастотной области сигнала; «Линейная» - высокочастотной.
  6. «Разрешение картинки» – задается размер изображения сонограммы в пикселях.

 

На рисунке 6 представлена  структура изображения вейвлет-сонограммы речевого сигнала.

 

Рис. 6. Структура изображения вейвлет-сонограммы речевого сигнала

 

Все операции, выполняемые WaveView-VSA можно разделить на 3 группы. Первая группа находится в разделе меню «Правка», включает такие операции, как «вырезать», «копировать», «вставить». Вторая группа операций находится в разделе меню «Вид», обеспечивает получение информации об анализируемом сигнале:

·         «Приближение» - изменение масштаба изображения;

·         «Интерполяция» - отображение отсчетов сигнала при значительном увеличении;

·         «Сонограмма» - построение сонограммы по заданным параметрам;

·         «W-фильтрация» - фильтрации сигнала с использованием вейвлетов Добеши, Койфмана, Шеннона;

·         «Фазовая составляющая» - вычисление фазы сигнала;

·         «Информация о звуке» - отображение значений частоты дискретизации, разрядности, длительности записи и отношения сигнал/шум.


Третья группа
операций находится в разделе меню «Преобразования».  Возможна обработка всего файла сигнала, либо  выделенной его части. Виды операций:

·         «Инверсия времени» - считывание отсчетов сигнала в обратном порядке;

·         «Инверсия по частоте» - преобразование сигнала в частотной области.

·         «Режекция частотной составляющей» - удаление из сигнала указанной частоты.

·         «Сдвиг по частоте» - сдвиг сигнала на заданную величину в герцах.

·         «Инверсия по фазе» -  поворот фазы сигнала на 180 градусов.

 

4. Обработка речевых сигналов с использованием вейвлет-преобразования

 

На рисунке 7 представлены: вейвлет-сонограмма, полученная WaveView-VSА и Фурье-сонограмма слов «раз», «два», «три», «четыре», «пять», «шесть».

 

ScreenShot_039

Рис. 7. Сравнение Фурье- и вейвлет-сонограмм. Верхнее изображение: вейвлет-сонограмма; нижнее: Фурье-сонограмма слов «раз», «два», «три», «четыре», «пять», «шесть»; слева внизу – параметры построения вейвлет-сонограммы

 

Существенные преимущества многоуровневого вейвлет-анализа по сравнению с традиционным анализом на основе преобразования Фурье при решении задач фоноскопической экспертизы аудиозаписей показаны в работах  [8-13].

 Визуализация гласных и согласных звуков речи

 Многоуровневая вейвлет-сонограмма (в дальнейшем - сонограмма) обеспечивает визуализацию работы голосовых связок (складок) диктора, а также позволяет получить точную информацию о спектральном составе не только тональных участков речи (гласных), но и согласных звуков (рис. 8).

 

Рис. 8. Вейвлет-сонограмма слова «шесть». На тональном участке гласной «е» видна последовательность пульсаций голосовых складок диктора, характеризующих стабильность значения периода основного тона

 

 Оценка эмоциональной напряженности диктора

 В ходе поисковых исследований, проведенных в МГТУ им. Н.Э. Баумана в период с 2003 г. по 2014 г. регистрировались образцы речи студентов 6 курса кафедры «Информационная безопасность» на различных этапах учебного процесса [12]. Обработаны  аудиозаписи 695 студентов 6-го курса, находящихся в условиях с повышенной  эмоциональной напряженностью при сдаче экзамена и защите дипломного проекта. В качестве контрольных (эмоционально-нейтральных) записей использовались тестовые фразы речи студентов, зарегистрированные ими самостоятельно при выполнении лабораторной работы.

На рисунках 9, 10, 11 представлены вейвлет-сонограммы фрагментов речи студентов, сдающих экзамен.  На рисунке 12 - вейвлет-сонограмма аудиозаписи речи студента, не испытывающего волнение.

 

Соногр

Рис. 9. Вейвлет-сонограмма фрагмента речи студента, сдающего экзамен. На последовательности пульсации голосовых складок заметны их «микросодрагания»; «разрушение» структуры тонального участка; в низкочастотной области - сигнал с частотой 24-28 Гц

 

ScreenShot_053

Рис. 10. Вейвлет-сонограмма фрагмента речи студента, сдающего экзамен. В низкочастотной области наблюдается сигнал с частотой 24-28 Гц, характеризующий эмоциональную напряженность диктора

 

ScreenShot_068

Рис. 11. Вейвлет-сонограмма фрагмента речевого сигнала ответа студента на экзамене. Низкочастотный сигнал 20-30 Гц характеризует значительную эмоциональную напряженность диктора. На участке 1 сек. наблюдается «разрушение» спектрально-временной структуры гласного звука. На частоте 50 Гц заметен сигнал фона сети питания малого уровня

 

Рис. 12. Вейвлет-сонограмма аудиозаписи речи студента, не испытывающего волнение

 

По результатам анализа аудиозаписей студентов с различным уровнем эмоциональной нагрузки  выявлены признаки «эмоциональной» речи. К ним следует отнести: «микросодрагание» голосовых складок;  «разрушение» спектрально-временной структуры тональных  участков сигнала; появление в низкочастотной части спектра колебаний с частотой 20-30 Гц.

 

Определение подлинности фонограмм

В  последние годы эксперты-фоноскописты относят к первоочередным решение задач, связанных с определением подлинности аудиозаписей или обнаружением следов нарушения достоверности фонограмм. Развитие и широкое распространение компьютерных средств обработки и монтажа аудиозаписей, доступность детальной информации о выполнении таких действий привели к ситуации, когда создание смонтированной фонограммы с измененными текстами реплик, составом дикторов и привнесенной при монтаже фоновой акустической обстановкой является относительно простой задачей даже для непрофессионала [13]. В то же время в отечественной судебной практике все чаще к уголовным и гражданским делам приобщаются цифровые фонограммы,  так как в соответствии с Гражданским процессуальным и Уголовно-процессуальным кодексами РФ аудио- и видеозаписи включены в перечень допустимых доказательств (статья 55 ГПК РФ и статья 84 УПК РФ).

Программные средства WaveView- VSA в режиме «Звуковой микроскоп» обеспечивают «визуализацию» параметров сигнала фонограммы с высоким частотно-временным разрешением. На рисунке 13 представлена вейвлет-сонограмма аудиозаписи с двумя участками монтажа.

 

Рис. 13. Вейвлет-сонограмма аудиозаписи с двумя участками монтажа  (соответствуют разрывам сигнала фона сети питания 50 Гц). Запись речи диктора выполнена в помещении и на улице. При регистрации речевого сигнала в помещении использован цифровой микрофон  Labtec Verse-704 USB, частота дискретизации 8 кГц, 16 бит; две вставки речевого сигнала, зарегистрированы  с использованием диктофоне «Гном-2М». Запись обработана эквалайзером, подавление частот в полосе 0 – 100 Гц - 60 дБ


Отображение акустической обстановки

WaveView-VSA обеспечивает отображение или визуализацию сигналов акустической обстановки с использованием функции построения вейвлет-сонограмм повышенного частотно-временного разрешения. На рисунке 14 представлены результаты обработки звуковых сигналов, зарегистрированных специализированным диктофоном «Гном-2М» в различных помещениях, имеющих электропроводку. На сонограммах видны сигналы фона сети питания, которые являются индивидуальными признаками акустической обстановки окружения.

а)                                                                       в)

ScreenShot_024

б)                                                                                 г)

Рис. 14. Вейвлет-сонограммы сигналов акустической обстановки различных помещений; a) 50 Гц, гармоники: 100 Гц, 150 Гц, 200 Гц; б) 50 Гц, гармоника 120 Гц; в) 50 Гц; г)  50 Гц, гармоники: 100 Гц, 200 Гц

 

5. Заключение

 

WaveView-VSА является одной из последних версий семейства программ  вейвлет-анализа WaveView. Относится к программам нового поколения обработки и визуализации речевых  и акустических сигналов с функцией «звуковой микроскоп» на основе многоуровневого вейвлет-преобразования и возможностью  выбора материнского вейвлета: Добеши, Койфмана, Морле, Шеннона, «Мексиканская шляпа». Отличительной особенностью многоуровневого вейвлет-анализа является повышенная точность частотно-временного представления сложных нестационарных акустических сигналов малого уровня. WaveView-VSА используется студентами 6 курса кафедры «Информационная безопасность»  (ИУ-8) МГТУ им. Н.Э. Баумана при выполнении цикла лабораторных работ «Криминалистическое исследование фонограмм». Одна из первых программ вейвлет-анализа WaveView-1 разработана в 2002 году [14, 15], по настоящее время находит применение у студентов кафедры «Медико-технические и информационные технологии» (БМТ-2) факультета «Биомедицинская техника» МГТУ им. Н.Э. Баумана  при проведении исследований и визуализации акустических биомедицинских сигналов.

 

Cписок литературы

 

[1]     Центр Речевых Технологий. ИКАР Лаб: Комплекс криминалистического исследования фонограмм речи. 2015. http://www.speechpro.ru/product/analysis/criminalistic/ikarlab.

[2]     Целевые технологии. Justiphone: Интерактивная система криминалистического исследования фонограмм устной речи. 2015. http://aimtech.ru/en/catalog/3.

[3]     ОТ-КОНТАКТ. OTExpert: Программный комплекс криминалистического исследования фонограмм и видеофонограмм. 2015. http://www.otexpert.pro/overview/.

[4]     Астафьева Н.М. Вейвлет-анализ: основы теории и примеры применения // Успехи физических наук, 1996 г., том 166, № 11. С. 1145-1170.

[5]     Дремин И.М., Иванов О.В., Нечитайло В.А. Вейвлеты и их использование // Успехи физических наук, 2001 г., том 171, № 5. С. 465-500.

[6]     Daubechies. Ten Lectures on Wavelets // Number 61 in CBMS-NSF Series in Applied Mathematics. SIAM Publications, Philadelphia, 1992.

[7]     Горшков Ю.Г. Оценка эмоционального состояния человека на основе многоуровневого вейвлет-анализа речи // Биомедицинская радиоэлектроника, 2014 г., № 10. C. 64-70.

[8]     Горшков Ю.Г. Многоуровневый вейвлет-анализ акустических сигналов при решении задач фоноскопической экспертизы // Материалы XX Международной научной конференции «Информатизация и информационная безопасность правоохранительных органов», 24 - 25 мая 2011 г. С. 379-387.

[9]     Горшков Ю.Г. Исследовательский комплекс частотно-временного анализа речевого сигнала с использованием вейвлет-технологии // Вестник МГТУ им. Н.Э. Баумана. Серия: Приборостроение, 2011 г., № 4. С. 78-87.

[10]     Горшков Ю.Г. Инструментальное исследование фонограмм с использованием  программных средств многоуровневого вейвлет-анализа сигналов // Материалы     Международного научного конгресса по информатике: информационные системы и технологии (CSIST'2011), 31 октября - 3 ноября 2011 г. Минск: БГУ, 2011 г. Ч. 1. C. 60-65.   

[11]     Горшков Ю.Г., Каиндин А.М. Инструментальные средства фоноскопической экспертизы аудиозаписей // Вестник МГТУ им. Н.Э. Баумана. Серия: Приборостроение, 2012 г., № 2. С. 37-47.

[12]     Горшков Ю.Г. Высокоточная обработка речевых сигналов с использованием многоуровневого вейвлет-анализа // Материалы VIII Международной отраслевой научно-технической конференции «Технологии информационного общества». Секция 4. Цифровое телерадиовещание и аудиовидеоинформатика, 20-21 февраля 2014 г. - М.: МТУСИ. С. 16.

[13]    Горшков Ю.Г. Применение комплекса «ЭКСПЕРТ МВА» при криминалистическом исследовании фонограмм // Материалы XXIII Всероссийской научной конференции «Информатизация и информационная безопасность правоохранительных органов», 28 мая 2014 г. С. 212-217.

[14]    Горшков Ю.Г. Новые решения речевых технологий безопасности // Специальная техника, 2006 г., № 4. С. 41-47.

[15]    Горшков Ю.Г. Анализ и засекречивание речевого сигнала: Учебное пособие. – М.: Издательство МГТУ им. Н.Э. Баумана, 2007 г. 36 с.




VISUALIZATION OF MULTI LEVEL WAVELET ANALYSIS OF PHONOGRAMS

Y.G. Gorshkov

Bauman Moscow State Technical University, Russian Federation

y.gorshkov@npo-echelon.ru

 

Abstract

Multi-level wavelet signal analysis allows to solve tasks of determination of authenticity of phonograms, estimation of the speaker’s emotional tension, specification of acoustic scenery with precision unavailable at digital processing based on the Fourier transform. Researches carried out in Bauman MSTU with the use of the software package WaveView-VSA have shown that wavelet sonograms are much more informative  compared to traditional Fourier spectrograms and, in contrast to the latter ones, they allow to easily identify the finest local peculiarities of acoustic signals. The technology of speech wavelet-sonogram obtainment with high time and frequency resolution. It compares the time-frequency characteristics of sonograms of speech sounds based on the Fourier transform and a multilevel wavelet transform. Results of phonoscopic researches of audio recordings when solving tasks of definition of phonograms originality and evaluation of his/her emotional tension. It provides examples of the sonograms  of signals of acoustic environment.

 

Keywords: speech signal, multi-level wavelet analysis, sonogram, authenticity of phonograms, emotional tension, acoustic environment.

 

References

 

[1]   Tsentr Rechevyih Tehnologiy. IKAR Lab: Kompleks kriminalisticheskogo issledovaniya fonogramm rechi. 2015. Available at: http://www.speechpro.ru/product/analysis/criminalistic/ikarlab. [In Russian]

[2]   Tselevyie tehnologii. Justiphone: Interaktivnaya sistema kriminalisticheskogo issledovaniya fonogramm ustnoy rechi. 2015. Available at: http://aimtech.ru/en/catalog/3. [In Russian]

[3]   OT-KONTAKT. OTExpert: Programmnyiy kompleks kriminalisticheskogo issledovaniya fonogramm i videofonogramm. 2015. Available  at: http://www.otexpert.pro/overview/.[In Russian]

[4]   Astafeva N.M. Veyvlet-analiz: osnovyi teorii i primeryi primeneniya [Wavelet-analiz: bases of the theory and examples of application]. Uspehi fizicheskih nauk [Achievements of physical sciences], 1996, vol. 166, no. 11, pp. 1145-1170. [In Russian]

[5]   Dremin I.M., Ivanov O.V., Nechitaylo V.A. Veyvletyi i ih ispolzovanie [Wavelets  and their use]. Uspehi fizicheskih nauk [Achievements of physical sciences], 2001, vol. 171, no. 5, pp. 465-500. [In Russian]

[6]   Daubechies. Ten Lectures on Wavelets. Number 61 in CBMS-NSF Series in Applied Mathematics. SIAM Publications, Philadelphia, 1992.

[7]   Gorshkov Yu.G. Otsenka emotsionalnogo sostoyaniya cheloveka na osnove mnogourovnevogo veyvlet-analiza rechi [Assessment of a person’s emotional state based on a multilevel wavelet analysis of speech]. Biomeditsinskaya radioelektronika [Biomedical radioelectronics], 2014, no. 10, pp. 64-70. [In Russian]

[8]   Gorshkov Yu.G. Mnogourovnevyiy veyvlet-analiz akusticheskih signalov pri reshenii zadach fonoskopicheskoy ekspertizyi [Multi-level wavelet analysis of acoustic signals in solving expertise phonoscopic]. Materialyi XX Mezhdunarodnoy nauchnoy konferentsii «Informatizatsiya i informatsionnaya bezopasnost pravoohranitelnyih organov» [Proceedings of the XX International scientific conference «Informatization and information security law enforcement agencies»], May 24 - 25, 2011, pp. 379-387. [In Russian]

[9]   Gorshkov Yu.G. Issledovatelskiy kompleks chastotno-vremennogo analiza rechevogo signala s ispolzovaniem veyvlet-tehnologii [Research complex time-frequency analysis of the speech signal using wavelet technology]. Vestnik MGTU im. N.E. Baumana. Seriya: Priborostroenie [Herald of the Bauman Moscow State Technical University. Series: Instrument Engineering], 2011, no. 4, pp. 78-87. [In Russian]

[10] Gorshkov Yu.G. Instrumentalnoe issledovanie fonogramm s ispolzovaniem programmnyih sredstv mnogourovnevogo veyvlet-analiza signalov [Instrumental examination of phonograms using software multilevel wavelet analysis of signals]. Materialyi Mezhdunarodnogo nauchnogo kongressa po informatike: informatsionnyie sistemyi i tehnologii (CSIST'2011) [Proceedings of the International congress on Computer Science: Information Systems and Technologies], October 31 - November 3, 2011, Minsk: BGU, part 1, pp. 60-65.   [In Russian]

[11] Gorshkov Yu.G., Kaindin A.M. Instrumentalnyie sredstva fonoskopicheskoy ekspertizyi audiozapisey [Tools phonoscopic audio expertise]. Vestnik MGTU im. N.E. Baumana. Seriya: Priborostroenie [Herald of the Bauman Moscow State Technical University. Series: Instrument Engineering], 2012, no.  2, pp. 37-47. [In Russian]

[12] Gorshkov Yu.G. Vyisokotochnaya obrabotka rechevyih signalov s ispolzovaniem mnogourovnevogo veyvlet-analiza [High-precision processing of speech signals using multi-level wavelet analysis]. Materialyi VIII Mezhdunarodnoy otraslevoy nauchno-tehnicheskoy konferentsii «Tehnologii informatsionnogo obschestva». Sektsiya 4. Tsifrovoe teleradioveschanie i audiovideoinformatika [Proceedings of the VIII International Industrial Science and Technology Conference «Information Society Technologies». Section 4. The digital broadcasting and audiovideoinformatika], February 20-21, 2014. - M.: MTUSI. p. 16. [In Russian]

[13] Gorshkov Yu.G. Primenenie kompleksa «EKSPERT MVA» pri kriminalisticheskom issledovanii fonogramm [The use of complex «EXPERT MVA» in forensic investigation of phonograms]. Materialyi XXIII Vserossiyskoy nauchnoy konferentsii «Informatizatsiya i informatsionnaya bezopasnost pravoohranitelnyih organov» [Materials XXIII Scientific Conference «Informatization and information security law enforcement agencies»], May 28, 2014, pp. 212-217. [In Russian]

[14] Gorshkov Yu.G. Novyie resheniya rechevyih tehnologiy bezopasnosti [New speech technology security solutions]. Spetsialnaya tehnika [Special equipment], 2006, no. 4, pp. 41-47. [In Russian]

[15] Gorshkov Yu.G. Analiz i zasekrechivanie rechevogo signala: Uchebnoe posobie [Analysis and scrambling of a voice signal: Manual]. – M.: Izdatelstvo MGTU im. N.E. Baumana [Publisher MSTU named after N.E. Bauman], 2007, 36 p. [In Russian]