Научная визуализация

Scientific Visualization

Электронный журнал открытого доступа

Национальный Исследовательский Ядерный Университет "МИФИ"

      ISSN 2079-3537      

 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                                                                                             

Научная визуализация, 2019, том 11, номер 4, страницы 13 - 26, DOI: 10.26583/sv.11.4.02

Подходы к визуализации больших массивов текстовых данных на этапе их сбора и предобработки

Авторы: Е. А. Макарова1, Д.Г. Лагерев2, Ф. Ю. Лозбинев3

Брянский государственный технический университет

1 ORCID: 0000-0002-5410-5890 , m4karova.e@yandex.ru

2 ORCID: 0000-0002-2702-6492 , LagerevDG@mail.ru

3 ORCID: 0000-0002-8745-6910

 

Аннотация

В статье рассмотрен процесс анализа текстовых данных в процессе разработки управленческих решений. Наиболее подробно рассмотрен процесс сбора текстовых данных для дальнейшего анализа, а так же вопросы использования визуализации с целью увеличения эффективности использования человеческих ресурсов на этапах сбора и предобработки данных. Предложена модификация алгоритма для создания визуализации «облако n-gram», позволяющая сделать визуализацию доступной для людей с ограничениями по зрению. Так же предложены методы визуализации моделей векторного представления n-gram (word embedding). На основе проведенных исследований реализована часть программного комплекса, отвечающая за создание интерактивных визуализаций в браузере и взаимодействие с ними.

 

Ключевые слова: визуализация, обработка естественного языка, доступность веб-приложений.