СИСТЕМА ВИЗУАЛИЗАЦИИ И АНАЛИЗА МНОГОМЕРНЫХ ДАННЫХ МЕДИКО-СОЦИАЛЬНЫХ ИССЛЕДОВАНИЙ
О.М. Гергет1, О.В. Марухина1, Ю.А. Черкашина1, Т.С. Кривоногова2
1Национальный исследовательский Томский политехнический университет, 634050, г. Томск, пр. Ленина, 30
2 Сибирский государственный медицинский университет, ЛОЦ «Здоровая мама-крепкий малыш», 634049, г.Томск, ул. Транспортная,5
olgagerget@mail.ru, marukhina@tpu.ru, cherr999y@mail.ru
Содержание
2. Визуализация многомерных экспериментальных данных на базе пакета NovoSpark Visualizer
Аннотация
В настоящее время существует множество подходов к решению задач анализа и визуализации многомерных данных. Так, например, авторы работ [1-3] предлагают использование методов Data Mining для сжатия размерности выделения групп объектов со схожими значениями признаков, и, таким образом, приведения данных к более удобной форме для анализа.
Современные статистические программные продукты имеют широкий спектр функций, позволяющих строить сотни типов различных графиков и диаграмм, в том числе так называемые пиктографики «Лица Чернова». Результаты применения последних в анализе психофизиологических данных представлены в [4]. Методы визуализации позволяют исследователю одним взглядом обнаружить особенности, выявить закономерности и аномалии в больших объемах информации. Особенно широко графические методы используются в разведочном анализе данных и задачах кластеризации, позволяя выявлять закономерности в многомерных массивах информации. Методы визуализации такого рода (метод главных компонент [5], методы структурного упорядочения [6,7] и др.) основаны, как правило, на переходе от многомерной к двумерной системе координат. Основной задачей визуализации данных является задача получения визуального образа, однозначно соответствующего набору данных [8]. В данной статье рассмотрен подход, предложенный В.А. Воловоденко [8,9], который позволяет провести визуализацию основных линейных конструкций: отрезков, ломаных линий, симплексов в многомерных пространствах. Похожий метод представлен в работе [10], который основан на построении образа многомерного объекта в виде кривой. Кривая строится на основе более «громоздких» для использования рядов Фурье. Ранее данных подход уже был описан в [11,12], но на примере решения задач из других прикладных областей. Выбор способа представления многомерного объекта (кривая, спектр) индивидуален для каждой задачи и определяется по согласованию с «заказчиком» исследования.
В статье представлена система визуализации и анализа многомерных данных, предназначенная для выявления главных аспектов набора данных без привлечения методов количественного анализа и проведения экспресс-диагностики состояния здоровья беременной женщины. В статье обосновывается необходимость решения задачи обработки многомерных данных с использованием специализированного пакета прикладных программ «NovoSpark Visualizer».
Приводится как иллюстративный пример, так и оценка здоровья беременных женщин на реальных данных. Рассмотрена методика анализа клинико-лабораторных показателей беременных женщин, позволяющая за минимальное число шагов оценить функциональное состояние здоровья женщин.
Ключевые слова: ранняя диагностика, визуализация многомерных данных, NovoSpark Visualizer, факторный анализ.
Динамика заболеваемости различных групп репродуктивного населения в последнее время имеет свои негативные тенденции.
Продолжает ухудшаться качество здоровья беременных женщин. По заключению Минздрава РФ, только 12,4 % женщин остаются здоровыми в течение беременности [13].
Высокая заболеваемость женщин репродуктивного возраста является основополагающим фактором развития различных осложнений при беременности и родах.
Неуклонно растет число детей с наследственной, врожденной патологией и родовыми травмами. Множество исследований показало, что основными причинами детской заболеваемости стабильно являются патологические состояния перинатального периода и врождённые пороки развития. Самыми важными периодами, когда закладывается физическое и психическое здоровье человека, являются внутриутробный период и раннее детство [14].
Числовые массивы показателей оформлены в виде больших числовых таблиц, поскольку охват исследуемых факторов и клинико-лабораторных показателей велик. Характерное число строк (объектов) в таблицах может доходить до нескольких десятков тысяч, а характерное число столбцов (признаков) – несколько сотен.
Выражение статистической информации в виде многомерных матриц оправдано, а показатели, содержащиеся в массивах являются многомерными данными [15].
Анализ многомерных данных представляет собой область знаний, в которой исследуются явления, процессы и системы, характеризуемые совокупностью величин. Эта область исследований является весьма важной с точки зрения практических приложений, поскольку большинство важных систем описывается набором переменных. Измерение сразу нескольких признаков (свойств объектов), в общем, более естественно, чем измерение лишь какого-то одного. Существуют различные методы, позволяющие производить анализ многомерных данных. Наиболее распространенные из них – факторный, кластерный и дискриминантный анализы.
Современные пакеты анализа информации меняет когнитивные навыки исследователя. В качестве исследовательского инструмента для решения задачи обработки многомерных данных авторами статьи был использован специализированный пакет прикладных программ «NovoSpark Visualizer» компании NovoSpark [16].
Выбор обусловлен главным образом тем, что данный пакет предназначен для качественного анализа статических и динамических многомерных данных посредством визуализации, в котором визуализация является основным инструментом, где многомерным наблюдениям соответствуют образы, содержащие в себе всю известную информацию об объектах данных.
Таким образом, исследуемой проблемой является определение совокупности технического, программного и организационного обеспечения, предназначенного для своевременного обеспечения медицинского персонала надлежащей информацией о состоянии здоровья женщины.
В статье рассмотрена система визуализации и анализа многомерных данных для решения задач диагностики состояния здоровья и выявления факторов, влияющих на функциональное состояние беременных женщин.
NovoSpark Visualizer (разработка компании NovoSpark) - это современный инструмент визуализации, который соединяет в себе интуитивность визуального анализа с описательной мощью статистических методов и предоставляет наиболее полную информацию о многомерных данных.
В пакете NovoSpark Visualizer реализован предложенный В.А. Воловоденко и коллективом исследователей подход [9], который позволяет провести визуализацию основных линейных конструкций: отрезков, ломаных линий, симплексов в многомерных пространствах. В рассматриваемом случае наиболее общей формой представления данных является вектор конечномерного пространства Rn
(1)
Для перехода от данного вектора к визуальному образу будет использоваться базис ортонормированных функций . В качестве такого базиса можно использовать известные функции, в частности ортонормированные полиномы Лежандра на отрезке [0,1], множество которых мы обозначим через . В таком случае точке с координатами можно поставить в соответствие функцию
(2)
Разница между формулами (1) и (2) заключается в том, что для вектора А из (1) возможно только аналитическое представление, в то время как для функции возможно представление в виде графика этой функции. Между (1) и (2) устанавливается взаимно-однозначная связь. Если ввести в рассмотрение второй вектор
, (3)
то ему ставится в соответствие функция
(4)
Будем считать, что функции и являются визуальными образами точек А и В, принадлежащих пространству Rn .
Если с векторами А и В связать точки их концов, а начала векторов разместить в начале координат пространства Rn, то получается взаимно-однозначная связь между точками пространства Rn и функциями-образами. Введем переменную Z и образуем линейное выражение
(5)
Очевидно: С(0) = А и С(1) = В.
Эта возможность дает право на рассмотрение функции С(z) как функции представляющей многомерную прямую линию, проходящую через точки А и В в пространстве Rn.
Следовательно, мы можем рассматривать выражение, аналогичное (5), для представления отрезка АВ:
, . (6)
Из выражения (6) следует, что можно образовать функцию
. (7)
Обратим внимание, что эта функция будет зависеть от двух аргументов . Это очень важно, так как дает возможность получения графика функции , который является визуальным образом отрезка АВ. Таким образом, получаем, что на квадрате [0,1]х[0,1] можно построить гладкую поверхность по формуле (7), которая будет однозначно соответствовать аналитическому выражению (6), представляющему многомерный отрезок АВ.
Основой визуализационного подхода NovoSpark являетcя представление многомерного наблюдения в виде двумерного образа-кривой. При этом гарантируется, что близким по значениям наблюдениям A и B будут соответствовать визуально близкие образы-кривые; для сильно различающихся по значениям наблюдений их образы-кривые будут заметно отличаться.
На сайте разработчика [16], в разделе «Case Study Overview» приведен ряд примеров из различных прикладных областей, с иллюстрациями, которые наглядно и полно продемонстрируют возможности программного продукта.
Исследования проводились на базе женской консультации №1 г. Томска и Центра «Здоровая мама - крепкий малыш». В женской консультации №1 проводилось лабораторно-инструментальное обследование по общепринятым методикам, в то время как Центр предоставлял возможность проведения занятий с беременными женщинами. В результате была сформирована выборка данных клинико-лабораторных показателей 198 женщин, их факторов риска и физической активности. Все женщины были ранжированы на три группы [17].
Первую (контрольную) группу составили 35 (17,7%) практически здоровых беременных женщин в возрасте от 20 до 42 лет, не получавших оздоровительных мероприятий.
Вторую (группу сравнения) составили 40 (20,2%) беременных женщин в возрасте от 18 до 40 лет, имевших соматические заболевания, не получавших комплекса оздоровительных мероприятий.
Третью (основную группу) составили 123 (62,1%) беременные женщины в возрасте от 19 до 43 лет, имеющие соматические заболевания, которым проводился комплекс оздоровительных мероприятий: 1. физические упражнения; 2. дыхательная гимнастика, аквагимнастика, физические упражнения.
Для каждого пациента введем обозначение – Wi, с целью сокрытия конфиденциальной информации и упрощения обозначений соответствующего наблюдения.
(8)
где ttg – тиреотропный гормон; t3 – трийодтиронин; t4 – тироксин; kor – кортизол; ins – инсулин; mda – малоновый диальдегид; e – витамин Е; gem – гемоглобин; tr – тромбоциты; bel – белок; fil – фибриноген.
Технология визуализации исходных данных осуществлялась в четыре этапа.
На первом этапе была сформирована функционально полная совокупность исходных данных.
На втором этапе исследования были выявлены и удалены аномальные наблюдения, наличие которых приводит к искажению результатов моделирования. Для выделения аномальных наблюдений в исследовании применялся критерии Ирвина. При использовании этого критерия вычисляется величина :
,
где , ,
где — исходные значения ряда.
Если полученное превышает табличное значение (определяется в зависимости от числа наблюдений во временном ряде и уровня значимости), то элемент считается аномальным наблюдением. Аномальные наблюдения были заменены на расчетные значения, как среднее из двух соседних значений.
Визуализация элементов осуществлялась с получением визуализированных когнитивных образов (ВКО) соответствующего вида [16], обозначаемого составным именем П1П2П3П4, содержащим позиционные параметры Пs (s = 1, 2, 3, 4) и определяемого соответствующими режимами обработки исходной информации.
Генерация образа VS-2D-1-NW была задана с помощью следующих параметров:
П1 = VS (фронтальный вид на плоскость YX);
П2 = 2D (вид сбоку 2D);
П3 = 1 (не преобразованные значения W);
П4 = NW (без фильтра).
На рис. 1 приведен пример визуализации данных в виде облака многомерного интервала. Если кривая наблюдения полностью лежит внутри облака, то соответсвующее ей наблюдение лежит внутри границ заданного интервала во всех измерениях, как это показано на рис.1.
Рис. 1. Выборка по группе контроля с аномальными наблюдениями VS-2D-1-NW.
На рис. 2 представлена выборка с удаленными аномальными наблюдениями.
Рис. 2. Общая выборка без аномальных наблюдений VS-2D-1-NW.
На третьем этапе сравниваются эталоны. Наборы отсортированы по расстоянию Махаланобиса [18] (рис.3).
Рис. 3. Сравнение групп эталонов в I триместр беременности.
Примечание: графики:
синего цвета характеризуют функциональное состояние здоровья женщин Контрольной группы;
фиолетового цвета — группа Сравнения;
красного цвета —Основная группа.
Как видно из рисунка 3, наблюдения основной группы и группы сравнения в I триместре беременности схожи. Однако, наблюдения контрольной группы резко отличаются от предыдущих групп. Это свидетельствует о том, что в состав групп Основная и Сравнения входят женщины, имеющие в анамнезе соматические заболевания.
Визуальное представление многомерных данных с помощью NovoSpark Visualizer, позволяет отнести исследуемый объект (состояние здоровья беременной женщины) к одному из непересекающихся образов (Контроль, Сравнения, Основная).
Верификация результатов решения, принимаемых при визуализации, осуществлялась численно-аналитическим методом, предложенным Тейлом:
,
где - предсказанное и фактическое значения.
В таблице 1 приведены предсказанные и фактические значения (I триместр беременности). В таблице 2 отображены предсказанные и фактические значения (III триместр беременности)
Таблица 1. Классификационная таблица.
Наблюденные |
Предсказанные |
||||
Значения |
|||||
Контроль |
Сравнение |
Основная |
% правильных |
||
Значения |
Контроль |
34 |
- |
1 |
97% |
Сравнение |
1 |
21 |
18 |
53% |
|
Основная |
- |
47 |
76 |
62% |
Таблица 2. Классификационная таблица.
Наблюденные |
Предсказанные |
||||
Значения |
|||||
Контроль |
Сравнение |
Основная |
% правильных |
||
Значения |
Контроль |
33 |
- |
2 |
94% |
Сравнение |
- |
39 |
1 |
98% |
|
Основная |
- |
3 |
120 |
98% |
Проведение комплекса оздоровительных мероприятий способствует повышению функциональных резервов женщин и формированию хорошей адаптации к различным факторам внешней и внутренней среды в III триместре беременности.
На четвертном этапе была произведена факторизация данных с получением системы безразмерных сопоставляемых факторов.
Полученный результат представлен в таблице 3.
Таблица 3. Состав факторов.
Фактор 1 |
Фактор 2 |
Фактор 3 |
tgg |
bel |
gem |
t3 |
tr |
mda |
kor |
fib |
e |
t4 |
Таблица 3 отображает виды лабораторно-инструментальных исследований, распределенные по трем факторам. Фактор 1 включает по большей части гормональные параметры. Фактор 2 отражает параметры красной крови, а фактор 3 отвечает за биохимические параметры и содержание витаминов. Влияние на каждую группу определенных факторов можно оценить с помощью таблицы 4.
Таблица 4. Влияние (положительное/отрицательное) факторов на каждую группу.
Наименование |
Сравниваемые группы |
|||||||
положительные/ отрицательные влияния |
Группа Контроль n = 34 |
Группа Сравнения n = 40 |
Основная группа n = 123 |
|||||
абс. |
% |
абс. |
% |
абс. |
% |
|||
Фактор 1 |
+ |
27 |
79,4% |
2 |
5,9% |
10 |
29,4 % |
|
- |
0 |
0% |
12 |
35,3% |
29 |
85,3% |
||
Фактор 2 |
+ |
3 |
7,5% |
6 |
15,0% |
19 |
47,5% |
|
- |
6 |
15,0% |
3 |
7,5% |
18 |
45,0% |
||
Фактор 3 |
+ |
0 |
0% |
6 |
4,9% |
22 |
17,9% |
|
- |
16 |
13,0% |
3 |
2,4% |
13 |
10,6% |
Поскольку каждое наблюдение может поддаваться влиянию сразу нескольких факторов, то проанализировать общую тенденцию достаточно сложно. Несмотря на это, из приведенной выше таблицы можно сделать следующие выводы: 1. Группа Контроль имеет сильную положительную зависимость от фактора 1, в то время, как группы Сравнения и Основная имеют отрицательную зависимость. 2. Слишком низкие показатели гормональных параметров связаны с угнетением функционального состояния щитовидной железы, возникшим, под влиянием постоянного действия факторов риска (стресс, частые обострения соматической патологии и др.), что характерно для группы сравнения и основной. Такое состояние у беременных женщин обуславливает длительное напряжение гипофизарно-тиреоидной системы (желез внутренней секреции), что может приводить к постепенному снижению не только адаптационных механизмов, но и к метаболическим нарушениям в щитовидной железе.
Исследуемые показатели женщин группы контроля не выходят из диапазона норм для данных показателей, что объясняет положительную зависимость от фактора 1.
Фактор 2 отображает биохимическую составляющую крови. Основная группа является как положительно, так и отрицательно зависимой от этого параметра. Поскольку данный фактор оказывает практически одинаковое как положительно, так и отрицательное влияние на основную группу, то сделать точные выводы о природе данной зависимости не является возможным.
Фактор 3 не выявил особой сильной зависимости. Однако дальнейшее исследование [19] малонового диальдегида (mda) и антиоксидантной активности крови (e) показали, что у женщин на фоне соматических заболеваний и угрозы прерывания беременности в I триместре беременности выявляются повышение концентрации МДА и пониженные показатели витамина E.
Таблица 5. Влияние (положительное/отрицательное) факторов на наблюдения пациентов относительно факторов риска.
Наименование |
положительные/ |
Фактор1 |
Фактор 2 |
Фактор 3 |
|||
абс. |
% |
абс. |
% |
абс. |
% |
||
Хронический |
+ |
4 |
14,8% |
5 |
18,5% |
9 |
33,3% |
- |
9 |
33,3% |
3 |
11,1% |
4 |
14,8% |
|
Хронический |
+ |
2 |
20,0% |
1 |
10,0% |
1 |
10,0% |
- |
3 |
30,0% |
0 |
0,0% |
2 |
20,0% |
|
Инфекции |
+ |
1 |
4,0% |
6 |
24,0% |
4 |
16,0% |
- |
12 |
48,0% |
8 |
32,0% |
4 |
16,0% |
|
Хронический |
+ |
0 |
0,0% |
2 |
9,5% |
1 |
4,8% |
- |
7 |
33,3% |
5 |
23,8% |
3 |
14,3% |
|
Варикозная |
+ |
2 |
13,3% |
2 |
13,3% |
4 |
26,7% |
- |
6 |
40,0% |
3 |
20,0% |
2 |
13,3% |
|
Атопический |
+ |
2 |
8,7% |
3 |
13,0% |
6 |
26,1% |
- |
9 |
39,1% |
4 |
17,4% |
4 |
17,4% |
|
Сколиоз |
+ |
0 |
0,0% |
0 |
0,0% |
1 |
50,0% |
- |
0 |
0,0% |
0 |
0,0% |
0 |
0,0% |
|
Хронический |
+ |
2 |
28,6% |
1 |
14,3% |
1 |
14,3% |
- |
1 |
14,3% |
1 |
14,3% |
2 |
28,8% |
|
Вазомоторный |
+ |
4 |
20,0% |
3 |
15,0% |
2 |
10,0% |
- |
7 |
35,0% |
3 |
15,0% |
6 |
30,0% |
На основании приведенной выше таблицы можно отметить отрицательное влияние фактора 1 практически на все заболевания, кроме гайморита и сколиоза. Таким образом, характерными признаками явились более низкие показатели содержания гормонов щитовидной железы t3, t4 и тиреотропного гормона (ttg). Из чего следует, что в формировании гормонального спектра крови женщин, страдающих различными формами соматических заболеваний, на фоне уже существующих болезней возможно угнетение функционального состояния щитовидной железы. Такое состояние может приводить к постепенному снижению не только адаптационных механизмов.
Третий фактор сочетает показания mda и витамина E. Увеличенное mda в I триместре беременности на фоне соматических заболеваний характеризуется угрозой преждевременного выкидыша и артериальной гипертензией, в то время как низкое показание витамина E усиливает радикальные окислительные процессы.
Система визуализации и анализа многомерных данных была запущена в опытную эксплуатацию в лечебно-оздоровительном Центре «Здоровая мама - крепкий малыш» для выявления главных аспектов набора данных без привлечения методов количественного анализа данных и проведения экспресс-диагностики состояния здоровья беременной женщины. Реализованный факторный анализ позволил разделить клинико-лабораторные показатели крови на три фактора. Определены взаимосвязи показателей внутри факторов и их влияние на наблюдения.
В результате эксплуатации системы была разработана методика анализа клинико-лабораторных показателей беременных женщин, состоящая из нескольких этапов:
1. Сбор данных (добавление показателей клинико-лабораторных анализов каждой женщины в базу данных).
2. Построение образа многомерного объекта (набор показателей для каждой женщины) в виде кривой.
3. Сравнение внешнего вида кривой с кривыми из контрольной группы (которая сформирована на этапе построение технологии визуализации).
4. Выявление показателей, по которым имеются существенные отклонения. Оценка значимости отклонений.
5. Формирование отчета для врача, ведущего наблюдение за женщиной, для более детальных медицинских исследований по выделенным показателям.
Данная методика позволяет за минимальное число шагов оценить функциональное состояние здоровья наблюдаемой беременной женщины. Она является дополнительным, «быстрым» инструментом, который входит в состав комплексной диагностики, применяемой в ЛОЦ «Здоровая мама – крепкий малыш».
1. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности. М.: Финансы и статистика, 1989. 606 с.
2. Cattell R. B. The scree test for the number of factors. Multivariate Behavioral Research. 1966. 1,245-276.
3. Lawley D.N., Maxwell A.E. Factor analysis as a statistical method. New York: American Elsevier. 1971.
4. Шаропин К.А., Берестнева О.Г., Шкатова Г.И. Визуализация результатов экспериментальных исследований. Известия Томского политехнического университета, 2010. Т. 316. № 5. С. 172–176.
5. Дюк В.А., Эммануэль В. Информационные технологии в медико-биологических исследованиях. СПб: Питер, 2003. 528 с.
6. Попечителев Е.П. Анализ числовых таблиц в биотехнических системах обработки экспериментальных данных. Л.: Наука, 1985. 148 с.
7. Шаропин К.А., Берестнева О.Г., Воловоденко В.А., Марухина О.В. Визуализация медицинских данных на базе пакета NovoSpark. Известия Южного федерального университета. Технические науки, 2010. Т. 109. № 8. С. 242–249.
8. Берестнева О.Г., Воловоденко В.А., Шаропин К.А., Гергет О.М. Визуализация экспериментальных многомерных данных на основе обобщенных графических образов. Вестник науки Сибири, 2011. № 1 (1). С. 363-369.
9. Воловоденко В.А., Берестнева О.Г., Немеров Е.В., Осадчая И.А. Применение методов визуализации при исследовании структуры экспериментальных многомерных данных. Известия Томского политехнического университета. 2012. Т. 320. № 5, с.125-130.
10. Berestneva O.G., Volovodenko V.A., Gerget O.M., Sharopin K.A., Osadchaya I.A. Multidimensional Medical Data Visualization Methods Based on Generalized Graphic Images. World Applied Sciences Journal 24 (Information Technologies in Modern Industry, Education & Society). Pp. 18-23. 2013.
11. Andrews D.F. Plots of High-Dimensional Data. International Biometric Society. 18 (1). p. 125–136. JSTOR 2528964, 1972.
12. Официальный сайт Департамента здравоохранения. URL: http://zdrav.tomsk.ru/.
13. Кривоногова Т.С., Желев В.А., Тропова Т.Е., Гергет О.М. Роль раннего комплекса оздоровительных мероприятий в охране здоровья матерей и их детей. Российский вестник перинатологии и педиатрии. 2009. Т. 54. № 3. С. 14-19.
14. Devyatykh D.V., Gerget O. M., Berestneva O. G. Sleep Apnea Detection Based on Dynamic Neural Networks. Communications in Computer and Information Science. 2014. Vol. 466. p. 556-567.
15. Кривоногова Т.С., Евтушенко И.Д., Тренькаева Н.А., Гладких Л.К., Гергет О.М. Комплексный подход к оздоровлению беременных женщин: Учебное пособие. Томск: ТУСУР. 2008. 122 с.
16. Эйдензон Д., Шамрони Д., Воловоденко В.А. Визуализация и анализ многомерных данных с использованием пакета NovoSpark® Visualizer. URL: http://cat.convdocs.org/docs/index-9799.html
17. NovoSpark® Visualizer URL: http://www.novospark.ru.
18. Тюрин Ю.Н., Макаров А.Н. Анализ данных на компьютере. Форум, 2008.
19. Бер А.А., Капилевич Л.В., Кривоногова Т.С. Влияние водно-дыхательного тренинга на гормональный статус и антиоксидантную активность сыворотки у беременных женщин. Теория и практика физической культуры. 2013. № 7. С. 59-62.
VISUALIZATION SYSTEMS AND MULTIVARIATE DATA ANALYSIS MEDICAL AND SOCIAL RESEARCH
O.M. Gerget1, O.V. Maruhina1, Yu.A. Cherkashina1, T.S. Krivonogova2
1 National Research Tomsk Polytechnic University, 634050, Tomsk, Lenin Avenue, 30
2Siberian state medical university, Medical and health center "Healthy mother-strong baby", 634049, Tomsk, Transportnaia Street, 5
olgagerget@mail.ru, marukhina@tpu.ru, cherr999y@mail.ru
Abstract
The article describes the system of visualization and analysis of multi-dimensional data for identification of the main aspects of the data set without involvement of quantitative analysis methods and express diagnostics of pregnant woman health. The need to solve the task of multidimensional data processing using «NovoSpark Visualizer» software package is proven in the article.
Illustrative example is given. Health of pregnant women is evaluated on real data. The method of analysis of clinical and laboratory parameters of pregnant women is observed which allows to assess the functional status of women's health for a minimum number of steps.
Keywords: pregnancy, childbearing, early disease detection, factor analysis, NovoSpark Visualizer, multivariate data analysis