Узагальнений підхід до вибіркового пошуку об'єктів на зображеннях

Власенко, Володимир Олександрович; Дашкевич, Андрій Олександрович; Воронцова, Дар'я Володимирівна; Охотська, Олена Вадимівна

Узагальнений підхід до вибіркового пошуку об'єктів на зображеннях

dc.contributor.author	Власенко, Володимир Олександрович
dc.contributor.author	Дашкевич, Андрій Олександрович
dc.contributor.author	Воронцова, Дар'я Володимирівна
dc.contributor.author	Охотська, Олена Вадимівна
dc.date.accessioned	2024-08-30T10:36:30Z
dc.date.available	2024-08-30T10:36:30Z
dc.date.issued	2023
dc.description.abstract	Роботу присвячено процесу дослідження та розробці власного підходу для розпізнавання обʼєктів на зображеннях у випадках вибіркового пошуку. У сучасному світі у сфері комп’ютерного зору та обробки зображень, розпізнавання об’єктів є одним із найважливіших напрямків досліджень. Застосування нейронних мереж, таких як YOLO (You Only Look Once) та R-CNN (Region-based Convolutional Neural Network), виявилося дуже ефективним у вирішенні цієї задачі. Ці алгоритми здатні знаходити об’єкти на зображеннях та повертати обмежувальні рамки, які точно описують ці об’єкти. Однак, у деяких випадках, коли ми працюємо з інтерактивними програмами, наприклад, обираємо об’єкт, клацаючи або торкаючись розпізнаної області, виникає проблема вибору правильного об’єкта та його обмежувальної рамки. Це може вплинути на точність визначення обраного об’єкта в контексті вибіркового пошуку. Виникає необхідність знайти таку область пошуку, яка дозволить нам належним чином визначити обраний об’єкт, особливо у випадку перетину обмежувальних рамок. Ефективний підхід до визначення розміру області пошуку та візуалізація процесу дослідження можуть покращити точність і швидкість вибору об’єктів, забезпечуючи більш зручний та ефективний пошук об’єктів на зображеннях. Ми пропонуємо вирішення проблеми перетину обмежувальних рамок, що виникає при роботі нейронних мереж типу YOLO та R-CNN, розробивши метод оцінки оптимального розміру області пошуку, який дозволить знайти відповідний об’єкт та його обмежувальну рамку та пропонуємо узагальнений підхід до візуалізації процесу дослідження, що дозволить наочно представити перекриття обмежувальних рамок та полегшить вибір оптимального об’єкта. Для підтвердження ефективності запропонованого методу ми проводимо експерименти на відповідному наборі даних та порівнюємо їх. Результати таких досліджень можуть мати значний практичний вплив на розробку систем розпізнавання об’єктів і покращення їх функціональності в цілому. Майбутні дослідження можуть фокусуватися на розширенні набору даних для випадків вибіркового пошуку, включаючи різні сценарії перекриття обмежувальних рамок та об’єктів з різною формою та розмірами.
dc.description.abstract	The work is devoted to the process of research and development of an own approach for object recognition in images in cases of selective search. In the modern world in the field of computer vision and image processing, object recognition is one of the most important areas of research. The use of neural networks, such as YOLO (You Only Look Once) and R-CNN (Region-based Convolutional Neural Network), has proven to be very efective in solving this problem. These algorithms are able to find objects in images and return bounding boxes that accurately describe those objects. However, in some cases when we work with interactive programs, for example, selecting an object by clicking or touching a recognized area, there is a problem of selecting the correct object and its bounding box. This can afect the accuracy of the selected object in the context of a selective search. It is necessary to find such a search area that will allow us to properly identify the selected object, especially in the case of crossing bounding boxes. An efective approach to the size of the search area and the visualization of the research process can improve the accuracy and speed of object selection, providing a more convenient and eficient object search in images. We ofer a solution to the problem of crossing the bounding frames that arises in the operation of YOLO and R-CNN type neural networks by developing a method for estimating the optimal size of the search area, which will allow finding the appropriate object and its bounding frame, and ofer a generalized approach to the visualization of the research process, which will allow to visually represent the overlap of the bounding frames and will facilitate the selection of the optimal object. To confirm the efectiveness of the proposed method, we conduct experiments on the appropriate data set and compare them. The results of such research can have a significant practical impact on the development of object recognition systems and improving their functionality as a whole. Future research may focus on expanding the dataset for selective search cases, including diferent bounding box overlap scenarios and objects with diferent shapes and sizes.
dc.identifier.citation	Узагальнений підхід до вибіркового пошуку об'єктів на зображеннях / Власенко В. О., Дашкевич А. О., Воронцова Д. В., Охотська О. В. // Сучасні проблеми моделювання : зб. наук. пр. / гол. ред. А. В. Найдиш. – Мелітополь : МДПУ, 2023. – № 25. – С. 84-92.
dc.identifier.orcid	https://orcid.org/0009-0008-6951-8496
dc.identifier.orcid	https://orcid.org/0000-0002-9963-0998
dc.identifier.orcid	https://orcid.org/0000-0001-7868-0067
dc.identifier.orcid	https://orcid.org/0000-0002-4810-2810
dc.identifier.uri	https://repository.kpi.kharkov.ua/handle/KhPI-Press/80636
dc.language.iso	uk
dc.publisher	Мелітопольський державний педагогічний університет ім. Богдана Хмельницького
dc.subject	дрони
dc.subject	вибірковий пошук об'єктів
dc.subject	обмежувальні рамки
dc.subject	нейронні мережі
dc.subject	YOLO
dc.subject	R-CNN
dc.subject	алгоритм розпізнавання
dc.subject	drones
dc.subject	selective object search
dc.subject	bounding boxes
dc.subject	neural networks
dc.subject	YOLO
dc.subject	R-CNN
dc.subject	recognition algorithm
dc.title	Узагальнений підхід до вибіркового пошуку об'єктів на зображеннях
dc.title.alternative	Generalized approach for object selective search in images
dc.type	Article

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: SPM_2023_25_Vlasenko_Uzahalnenyi_pidkhid.pdf
Розмір:: 4.4 MB
Формат:: Adobe Portable Document Format

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 11.25 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Колекції

Кафедра "Геометричне моделювання та комп'ютерна графіка"