ISSN 2079-3537      

 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                                                                                             
Научная визуализация
Год выпуска: 2016
Квартал: 3
Том: 8
Номер: 3
Страницы: 1 - 24
Название публикации: ВИЗУАЛЬНЫЙ АНАЛИЗ КЛАСТЕРНЫХ СТРУКТУР В МНОГОМЕРНЫХ ОБЪЕМАХ ТЕКСТОВОЙ ИНФОРМАЦИИ
Авторы: А.Е. Бондарев (Россия), А.В. Бондаренко (Россия), В.А. Галактионов (Россия), Э.С. Клышинский (Россия)
Адреса авторов: А.Е. Бондарев
bond@keldysh.ru
Институт прикладной математики им. М.В.Келдыша РАН, Москва, Россия

А.В. Бондаренко
ФГУП ГосНИИАС, Москва, Россия

В.А. Галактионов
vlgal@gin.keldysh.ru
Институт прикладной математики им. М.В.Келдыша РАН, Москва, Россия

Э.С. Клышинский
klyshinsky@mail.ru
Институт прикладной математики им. М.В.Келдыша РАН, Москва, Россия
НИУ ВШЭ, Москва, Россия
Краткое описание: Работа рассматривает вопросы визуального анализа кластерных структур в многомерных объемах текстовой информации. Для анализа кластерных структур в многомерном объеме текстовых данных используются технологии построения упругих карт, представляющие собой методы отображения точек исходного многомерного пространства на вложенные в это пространство многообразия меньшей размерности. Варьируя поверхность упругой карты за счет последовательного уменьшения коэффициентов упругости, можно добиться лучшей аппроксимации картой многомерного облака данных. Применение технологий построения упругих карт для решения задач кластерного анализа не предполагает никакой априорной информации об изучаемых данных и не зависит от их природы, происхождения и т.п. Схожими свойствами обладает близкий по идеологии вероятностный подход к снижению размерности t-SNE. Данная работа содержит описание результатов построения упругих карт и применения подхода t-SNE для визуального анализа кластерных структур в многомерных объемах текстовой информации. Для упругих карт подробно описан и проиллюстрирован прием «квази-зум», позволяющий существенно улучшить результаты в области сгущения точек изучаемого многомерного пространства. Для обоих подходов (построение упругих карт и t-SNE) показана их работоспособность и применимость для решения задач кластеризации терминов естественного языка.
Язык: Русский


Открыть публикацию   Скачать публикацию в ZIP архиве