Узагальнений підхід до вибіркового пошуку об'єктів на зображеннях

dc.contributor.authorВласенко, Володимир Олександрович
dc.contributor.authorДашкевич, Андрій Олександрович
dc.contributor.authorВоронцова, Дар'я Володимирівна
dc.contributor.authorОхотська, Олена Вадимівна
dc.date.accessioned2024-08-30T10:36:30Z
dc.date.available2024-08-30T10:36:30Z
dc.date.issued2023
dc.description.abstractРоботу присвячено процесу дослідження та розробці власного підходу для розпізнавання обʼєктів на зображеннях у випадках вибіркового пошуку. У сучасному світі у сфері комп’ютерного зору та обробки зображень, розпізнавання об’єктів є одним із найважливіших напрямків досліджень. Застосування нейронних мереж, таких як YOLO (You Only Look Once) та R-CNN (Region-based Convolutional Neural Network), виявилося дуже ефективним у вирішенні цієї задачі. Ці алгоритми здатні знаходити об’єкти на зображеннях та повертати обмежувальні рамки, які точно описують ці об’єкти. Однак, у деяких випадках, коли ми працюємо з інтерактивними програмами, наприклад, обираємо об’єкт, клацаючи або торкаючись розпізнаної області, виникає проблема вибору правильного об’єкта та його обмежувальної рамки. Це може вплинути на точність визначення обраного об’єкта в контексті вибіркового пошуку. Виникає необхідність знайти таку область пошуку, яка дозволить нам належним чином визначити обраний об’єкт, особливо у випадку перетину обмежувальних рамок. Ефективний підхід до визначення розміру області пошуку та візуалізація процесу дослідження можуть покращити точність і швидкість вибору об’єктів, забезпечуючи більш зручний та ефективний пошук об’єктів на зображеннях. Ми пропонуємо вирішення проблеми перетину обмежувальних рамок, що виникає при роботі нейронних мереж типу YOLO та R-CNN, розробивши метод оцінки оптимального розміру області пошуку, який дозволить знайти відповідний об’єкт та його обмежувальну рамку та пропонуємо узагальнений підхід до візуалізації процесу дослідження, що дозволить наочно представити перекриття обмежувальних рамок та полегшить вибір оптимального об’єкта. Для підтвердження ефективності запропонованого методу ми проводимо експерименти на відповідному наборі даних та порівнюємо їх. Результати таких досліджень можуть мати значний практичний вплив на розробку систем розпізнавання об’єктів і покращення їх функціональності в цілому. Майбутні дослідження можуть фокусуватися на розширенні набору даних для випадків вибіркового пошуку, включаючи різні сценарії перекриття обмежувальних рамок та об’єктів з різною формою та розмірами.
dc.description.abstractThe work is devoted to the process of research and development of an own approach for object recognition in images in cases of selective search. In the modern world in the field of computer vision and image processing, object recognition is one of the most important areas of research. The use of neural networks, such as YOLO (You Only Look Once) and R-CNN (Region-based Convolutional Neural Network), has proven to be very efective in solving this problem. These algorithms are able to find objects in images and return bounding boxes that accurately describe those objects. However, in some cases when we work with interactive programs, for example, selecting an object by clicking or touching a recognized area, there is a problem of selecting the correct object and its bounding box. This can afect the accuracy of the selected object in the context of a selective search. It is necessary to find such a search area that will allow us to properly identify the selected object, especially in the case of crossing bounding boxes. An efective approach to the size of the search area and the visualization of the research process can improve the accuracy and speed of object selection, providing a more convenient and eficient object search in images. We ofer a solution to the problem of crossing the bounding frames that arises in the operation of YOLO and R-CNN type neural networks by developing a method for estimating the optimal size of the search area, which will allow finding the appropriate object and its bounding frame, and ofer a generalized approach to the visualization of the research process, which will allow to visually represent the overlap of the bounding frames and will facilitate the selection of the optimal object. To confirm the efectiveness of the proposed method, we conduct experiments on the appropriate data set and compare them. The results of such research can have a significant practical impact on the development of object recognition systems and improving their functionality as a whole. Future research may focus on expanding the dataset for selective search cases, including diferent bounding box overlap scenarios and objects with diferent shapes and sizes.
dc.identifier.citationУзагальнений підхід до вибіркового пошуку об'єктів на зображеннях / Власенко В. О., Дашкевич А. О., Воронцова Д. В., Охотська О. В. // Сучасні проблеми моделювання : зб. наук. пр. / гол. ред. А. В. Найдиш. – Мелітополь : МДПУ, 2023. – № 25. – С. 84-92.
dc.identifier.orcidhttps://orcid.org/0009-0008-6951-8496
dc.identifier.orcidhttps://orcid.org/0000-0002-9963-0998
dc.identifier.orcidhttps://orcid.org/0000-0001-7868-0067
dc.identifier.orcidhttps://orcid.org/0000-0002-4810-2810
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/80636
dc.language.isouk
dc.publisherМелітопольський державний педагогічний університет ім. Богдана Хмельницького
dc.subjectдрони
dc.subjectвибірковий пошук об'єктів
dc.subjectобмежувальні рамки
dc.subjectнейронні мережі
dc.subjectYOLO
dc.subjectR-CNN
dc.subjectалгоритм розпізнавання
dc.subjectdrones
dc.subjectselective object search
dc.subjectbounding boxes
dc.subjectneural networks
dc.subjectYOLO
dc.subjectR-CNN
dc.subjectrecognition algorithm
dc.titleУзагальнений підхід до вибіркового пошуку об'єктів на зображеннях
dc.title.alternativeGeneralized approach for object selective search in images
dc.typeArticle

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Ескіз
Назва:
SPM_2023_25_Vlasenko_Uzahalnenyi_pidkhid.pdf
Розмір:
4.4 MB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
11.25 KB
Формат:
Item-specific license agreed upon to submission
Опис: