Використання моделей глибокого навчання U-Net, DeepLabV3+ та Feature Pyramid Network для семантичної сегментації аерофотознімків
| dc.contributor.author | Власенко, Віталій Олегович | |
| dc.date.accessioned | 2025-07-29T09:53:47Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | У роботі представлено дослідження ефективності використання моделей глибокого навчання U-Net, DeepLabV3+ та Feature Pyramid Network (FPN) для семантичної сегментації аерофотознімків. Ця задача дозволяє автоматизувати аналіз великих обсягів даних у різних сферах людської діяльності (містобудуванні, екологічного моніторингу тощо). У процесі дослідження було підготовлено власні вхідні дані та проведено навчання кожної з трьох моделей. Для оцінювання експериментальної роботи було розраховано функцію втрат, точність, індекс Жаккара, F-міру та час прогнозування одного зображення, що дозволило порівняти якість сегментації. Результати показують, що кожна модель здатна ефективно розпізнавати основні об’єкти на аерофотознімках. Модель U-Net демонструє кращу швидкість при навчанні, DeepLabV3+ навчається довше, але показує кращі показники, навіть на невеликій кількості вхідних даних, а FPN забезпечує найкращий баланс одночасно між швидкістю та якістю. Результати можуть бути використані для подальших досліджень у сфері автоматизованого аналізу зображень. The paper presents a study of the effectiveness of using deep learning models U-Net, DeepLabV3+ and Feature Pyramid Network (FPN) for semantic segmentation of aerial images. This task allows to automate the analysis of large amounts of data in various areas of human activity (urban planning, environmental monitoring, etc.). In the process of the study, our own input data was prepared and models were trained. To evaluate the experimental work, the loss function, accuracy, Jaccard index, F-measure, and prediction time of one image were calculated, which allowed us to compare the quality of segmentation. The results show that each model is able to effectively recognize the main objects in aerial photographs. The U-Net model demonstrates better speed during training, DeepLabV3+ trains longer, but shows better performance, even on a small amount of input data, and FPN provides the best balance between speed and quality at the same time. The results can be used for further research in the field of automated image analysis. | |
| dc.identifier.citation | Власенко В. О. Використання моделей глибокого навчання U-Net, DeepLabV3+ та Feature Pyramid Network для семантичної сегментації аерофотознімків / В. О. Власенко // Вісник Національного технічного університету "ХПІ". Серія: Інформатика і моделювання : зб. наук. пр. / гол. ред. Є. І. Сокол. – Харків: НТУ "ХПІ", 2025. – № 2 (14). – С. 31-43. | |
| dc.identifier.doi | https://doi.org/10.20998/2411-0558.2025.02.02 | |
| dc.identifier.orcid | https://orcid.org/0009-0008-6951-8496 | |
| dc.identifier.uri | https://repository.kpi.kharkov.ua/handle/KhPI-Press/91675 | |
| dc.language.iso | uk | |
| dc.publisher | Національний технічний університет "Харківський політехнічний інститут" | |
| dc.subject | комп'ютерний зір | |
| dc.subject | нейронні мережі | |
| dc.subject | глибоке навчання | |
| dc.subject | семантична сегментація | |
| dc.subject | розпізнавання об'єктів | |
| dc.subject | просторовий аналіз | |
| dc.subject | computer vision | |
| dc.subject | neural networks | |
| dc.subject | deep learning | |
| dc.subject | semantic segmentation | |
| dc.subject | object recognition | |
| dc.subject | spatial analysis | |
| dc.title | Використання моделей глибокого навчання U-Net, DeepLabV3+ та Feature Pyramid Network для семантичної сегментації аерофотознімків | |
| dc.title.alternative | Using deep learning models U-Net, DeepLabV3+ and Feature Pyramid Network for semantic segmentation of aerial images | |
| dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- visnyk_KhPI_2025_2_PIM_Vlasenko_Vykorystannia_modelei.pdf
- Розмір:
- 862.31 KB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Вантажиться...
- Назва:
- license.txt
- Розмір:
- 2.95 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис:
