Analysis of methods for classification and aggregation of textual data from images

This study investigates modern methods of text recognition from images, specifically comparing optical character recognition and intelligent character recognition. The technologies of machine learning, including convolutional and recurrent neural networks, are compared based on criteria such as accuracy and efficiency in processing handwritten and printed texts. The advantages and limitations of existing solutions for forming digital documents from images containing various handwriting styles and low-quality text images are analyzed. Key challenges associated with processing multilingual texts are identified, and future prospects for the development of text recognition technologies are discussed. У статті досліджуються сучасні методи розпізнавання тексту з зображень, зокрема порівнюються оптичне розпізнавання символів (ОРС) та інтелектуальне розпізнавання символів (ІРС). Розглянуто технології машинного навчання, включаючи згорткові нейронні мережі (ЗНМ) та рекурентні нейронні мережі (РНМ), які використовуються для підвищення точності та ефективності обробки рукописних і друкованих текстів. Вивчено переваги та обмеження існуючих рішень для формування цифрових документів з зображень, що містять різні стилі почерку і текст на зображеннях низької якості. Зокрема, ІРС демонструє високу адаптивність до змінних умов, що робить його ефективнішим у порівнянні з традиційними методами ОРС. Значна увага приділена здатності ICR обробляти багатомовні тексти, що розширює можливості її використання у різних сферах діяльності. У статті також аналізуються основні виклики, пов'язані з обробкою рукописного тексту різних стилів, а також необхідність покращення швидкості розпізнавання. Представлені результати свідчать про високий потенціал використання ЗНМ та РНМ у задачах ОРС, а також про перспективність гібридних моделей, що поєднують переваги обох підходів для досягнення дуже високої точності розпізнавання. Особливо важливим є застосування цих технологій у таких галузях, як цифрова обробка рукописних документів, автоматизація поштових послуг та розширення інструментів доступності. Ці висновки підкреслюють важливість подальших досліджень та розвитку технологій розпізнавання тексту для покращення ефективності обробки даних та інтеграції рукописних текстів у сучасні інформаційні системи. Дослідження показує, що технології машинного навчання та глибокого навчання можуть значно покращити точність розпізнавання тексту, зменшуючи необхідність людського втручання та прискорюючи процес обробки даних. У статті також розглядаються практичні аспекти впровадження цих технологій, зокрема, необхідність великих обчислювальних ресурсів для навчання моделей та забезпечення надійної роботи систем у різних умовах. Це дослідження є важливим внеском у розвиток технологій цифрової обробки тексту, що мають широкі перспективи застосування у різних галузях, включаючи науку, медицину, освіту та бізнес. Використання сучасних методів розпізнавання тексту дозволить значно підвищити ефективність обробки інформації та сприяти розвитку інноваційних рішень для роботи з великими обсягами даних.

Ключові слова

text recognition, machine learning, data processing automation, multilingual texts, comparative analysis, розпізнавання тексту, машинне навчання, автоматизація обробки даних, багатомовні тексти, порівняльний аналіз

Бібліографічний опис

Popovych B. Analysis of methods for classification and aggregation of textual data from images / Bohdan Popovych, Ganna Zavolodko // Security of Infocommunication Systems and Internet of Things = Безпека інфокомунікаційних систем та Інтернету речей. – 2024. – Vol. 2, № 1. – P. 1-5.

URI

https://repository.kpi.kharkov.ua/handle/KhPI-Press/95942

Колекції

Кафедра "Мультимедійні та інтернет технології і системи"

Повна інформація про документ
Google Scholar

Analysis of methods for classification and aggregation of textual data from images

Файли

Дата

Автори

ORCID

DOI

Науковий ступінь

Рівень дисертації

Шифр та назва спеціальності

Рада захисту

Установа захисту

Науковий керівник/консультант

Члени комітету

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Опис

Ключові слова

Бібліографічний опис

URI

Колекції

Підтвердження

Рецензія

Додано до

Згадується в