УДК 004.891
DOI: 10.36871/2618-9976.2025.12–2.005
Авторы
Егор Николаевич Волков,
Младший научный сотрудник, Научно-исследовательский центр Искусственного интеллекта, Государственный университет «Дубна», Московская область, Дубна, Россия
Алексей Николаевич Аверкин,
Кандидат физико-математических наук, доцент, ведущий научный сотрудник, Научно-исследовательский центр Искусственного интеллекта, Государственный университет «Дубна», Московская область, Дубна, Россия
Иван Алексеевич Матвеев,
Доктор технических наук, ведущий научный сотрудник, Научно-исследовательский центр Искусственного интеллекта, Государственный университет «Дубна», Московская область, Дубна, Россия
Аннотация
Рассмотрена задача повышения интерпретируемости детекции биомаркеров на ОКТ изображениях сетчатки. Предложена адаптация Grad-CAM для использования в задаче детекции объектов при применении одноэтапного детектора YOLOv5 с построением объяснений для каждой детекции класса. Проведена переаннотация датасета OCTDL (146 изображений, 384 экземпляра) и обучение YOLOv5m; проведено обучение и валидация модели. Показано согласование тепловых карт с зонами кист и предложена количественная оценка по перекрытию карт и разметки.
Благодарности: работа выполнена в рамках государственного задания Министерства науки и высшего образования Российской Федерации (тема № 124092700007–4 «Применение объяснительного искусственного интеллекта для интерпретации алгоритмов машинного обучения»).
Ключевые слова
оптическая когерентная томография
биомаркеры
детекция объектов
объяснимый искусственный интеллект
искусственный интеллект
компьютерное зрение
анализ изображений
XAI
ИИ
Grad-CAM
YOLO
Список литературы
[1] Selvaraju R. R., Cogswell M., Das A., Vedantam R., Parikh D., Batra D. Grad-CAM: Visual Explanations from Deep Networks via Gradient-Based Localization // International Journal of Computer Vision. 2020. Vol. 128, No. 2. P. 336–359. DOI: 10.1007/s11263-019-01228-7.
[2] van der Velden B. H. M., Kuijf H. J., Gilhuijs K. G. A., Viergever M. A. Explainable artificial intelligence (XAI) in deep learning-based medical image analysis // Medical Image Analysis. 2022. Vol. 79. Art. 102470. DOI: 10.1016/j.media.2022.102470.
[3] Borys K., Schmitt Y. A., Nauta M. [et al.]. Explainable AI in medical imaging: An overview for clinical practitioners — Beyond saliency-based XAI approaches // European Journal of Radiology. 2023. Vol. 162. Art. 110786. DOI: 10.1016/j.ejrad.2023.110786.
[4] Jocher G., Changyu L., Hogan A. Ultralytics YOLOv5. 2020. URL: https://docs.ultralytics.com/ models/yolov5.
[5] Bochkovskiy A., Wang C. Y., Liao H. Y. M. YOLOv4: Optimal Speed and Accuracy of Object Detection // arXiv. 2020.
[6] Redmon J., Farhadi A. YOLOv3: An Incremental Improvement // arXiv. 2018.
[7] Lin T. Y., Dollár P., Girshick R., He K., Hariharan B., Belongie S. Feature Pyramid Networks for Object Detection // arXiv. 2016.
[8] Rezatofighi H., Tsoi N., Gwak J., Sadeghian A., Reid I., Savarese S. Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression // arXiv. 2019.
[9] Zheng Z., Wang P., Liu W., Li J., Ye R., Ren D. Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression // arXiv. 2019.
[10] Kulyabin M., Zhdanov A., Nikiforova A. [et al.]. OCTDL: Optical Coherence Tomography Dataset for Image-Based Deep Learning Methods // Scientific Data. 2024. Vol. 11, No. 1. Art. 365. DOI: 10.1038/s41597-024-03182-7.
[11] Venhuizen F. G., van Ginneken B., Liefers B. [et al.]. Deep learning approach for the detection and quantification of intraretinal cystoid fluid in multivendor optical coherence tomography // Biomedical Optics Express. 2018. Vol. 9, No. 4. P. 1545–1569. DOI: 10.1364/BOE.9.001545.
[12] Kurmann T., Yu S., Márquez-Neila P. [et al.]. Expert-level automated biomarker identification in optical coherence tomography scans // Scientific Reports. 2019. Vol. 9. Art. 13605. DOI: 10.1038/s41598-019-49740-7.
[13] Leandro I., Lorenzo B., Miladinovic A. [et al.]. OCT-based deep-learning models for the identification of retinal key signs // Scientific Reports. 2023. Vol. 13. Art. 14628. DOI: 10.1038/s41598-023-41362-4.
[14] Saha S., Nassisi M., Wang M. [et al.]. Automated detection and classification of early AMD biomarkers using deep learning // Scientific Reports. 2019. Vol. 9. Art. 10990. DOI: 10.1038/s41598-019-47390-3.
[15] Samagaio G., Estévez A., de Moura J., Novo J., Fernández M. I., Ortega M. Automatic macular edema identification and characterization using OCT images // Computer Methods and Programs in Biomedicine. 2018. Vol. 163. P. 47–63. DOI: 10.1016/j.cmpb.2018.05.033.

