Image classifier for fast search in large databases

Ескіз

Дата

2024

DOI

https://doi.org/10.20998/2522-9052.2024.2.02

item.page.thesis.degree.name

item.page.thesis.degree.level

item.page.thesis.degree.discipline

item.page.thesis.degree.department

item.page.thesis.degree.grantor

item.page.thesis.degree.advisor

item.page.thesis.degree.committeeMember

Назва журналу

Номер ISSN

Назва тому

Видавець

Національний технічний університет "Харківський політехнічний інститут"

Анотація

Relevance. The avalanche-like growth in the amount of information on the Internet necessitates the development of effective methods for quickly processing such information in information systems.Clustering of news information is carried out by taking into account both the morphological analysis of texts and graphic content. Thus, an urgent task is the clustering of images accompanying textual information on various web resources, including news portals. The subject of studyis an image classifier that exhibits low sensitivity to increased information in databases. The purpose of the article is to enhance the efficiency of searching for identical images in databases experiencing a daily influx of 10-12 thousand images, by developing an image classifier. Methods used: mathematical modeling, content-based image retrieval, two-dimensional discrete cosine transform, image processing methods, decision-making methods. The following results were obtained. An image classifier has been developed with low sensitivity to increased database information. The properties of the developed classifier have been analyzed. The experiments demonstrated that clustering information based on images using the developed classifier proved to be sufficiently fast and cost-effective in terms of information volumes and computational power requirements. Актуальність. Лавиноподібне зростання кількості інформації в Інтернеті потребує розробки ефективних методів швидкої обробки такої інформації в інформаційних системах. Кластеризація новинної інформації проводиться як з урахуванням морфологічного аналізу текстів, так і графічного контенту. Таким чином, актуальним завданням є кластеризація зображень, що супроводжують текстову інформацію на різних веб-ресурсах, включаючи портали новин. Предмет дослідження:класифікатор зображень, що малочутливий до зростання кількості інформації в базах даних. Метою дослідженняє підвищення продуктивності пошуку однакових зображень у базах даних, у яких швидкість додавання інформації досягає 10-12 тисяч зображень на добу,шляхом розробки класифікатора зображень. Методи, що використовуються:математичне моделювання, пошук зображень на основі контенту, двовимірне дискретне косинусне перетворення, методи обробки зображень, методи прийняття рішень. Отримані результати.Розроблено класифікатор зображень, що малочутливий до зростання кількості інформації в базах даних. Виконано аналіз властивостей розробленого класифікатора. Проведені експерименти показали, що кластеризація інформації за зображеннями за допомогою розробленого класифікатора виявилася досить швидкою та маловитратною з погляду обсягів інформації та вимог до обчислювальної потужності.

Опис

Ключові слова

information systems, cosine transform, two-dimensional discret, mathematical modeling, image processing methods, experiments, omputational power, інформаційні системи, пошук, контент, класифікатор зображень, бази даних

Бібліографічний опис

Image classifier for fast search in large databases / V. Filatov, A. Filatova, A. Povoroznyuk, S. Omarov // Сучасні інформаційні системи = Advanced Information Systems. – 2024. – Т. 8, № 2. – С. 12-19

item.page.endorsement

item.page.review

item.page.supplemented

item.page.referenced