Научная визуализация

Scientific Visualization

Электронный журнал открытого доступа

Национальный Исследовательский Ядерный Университет "МИФИ"

      ISSN 2079-3537      

 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                                                                                             

Научная визуализация, 2024, том 16, номер 3, страницы 1 - 13, DOI: 10.26583/sv.16.3.01

Сравнение эффективности применения различных подходов в задаче детекции объекта на изображении низкого качества

Авторы: А.А. Проворова1, И.Ю. Полякова2, Е.В. Кузьмичева3

Центр когнитивных нейронаук, Национальный исследовательский университет «Высшая школа экономики», Пермь, Россия

1 ORCID: 0009-0009-1847-9498, aaprovorova@hse.ru

2 ORCID: 0009-0006-2811-823X, iyupolyakova@edu.hse.ru

3 ORCID: 0009-0000-6380-4688, EVKuzmicheva@hse.ru

 

Аннотация

Машинные методы анализа изображений набирают всё большую популярность в самых различных сферах жизни. Однако остается открытым вопрос, насколько эффективна работа таких алгоритмов на данных низкого качества, например, таких, какие могут использоваться в сфере телемедицины. В работе проведен сравнительный анализ различных подходов к детекции объектов на фотографиях МРТ-снимков головного мозга, сделанных с экрана компьютера. Для распознавания контуров головного мозга на изображении были использованы классический морфометрический подход (библиотека OpenCV), алгоритм Виолы-Джонса и два алгоритма глубокого обучения: YOLOv8 и EfficientDet. Сравнение данных методов проводилось с точки зрения качества обнаружения объекта на изображении, оцениваемого при помощи IoU-метрики, а также с точки зрения скорости работы и объема занимаемой памяти. В результате сравнения оказалось, что модель YOLOv8 продемонстрировала наилучший показатель качества обнаружения объектов, однако её работа была нестабильной в случаях некачественных изображений с высоким уровнем шума. Также среди рассмотренных подходов YOLOv8 является самой габаритной с точки зрения используемой памяти. Наилучшим кандидатом для дальнейшего практического применения как с точки зрения среднего показателя качества работы, так и с точки зрения устойчивости к шумам, можно считать сетевую архитектуру YOLOv8.

 

Ключевые слова: компьютерное зрение; детекция; OpenCV; Виола-Джонс; YOLOv8; EfficientDet.