Information technologies of neural network speech recognition in real-time

dc.contributor.authorSerdyuk, Iryna
dc.contributor.authorTonitsa, Oleh
dc.contributor.authorHeliarovska, Oksana
dc.contributor.authorYanovsky, Oleksiy
dc.date.accessioned2025-10-07T07:37:31Z
dc.date.issued2025
dc.description.abstractThe purpose of this work is to explore approaches to building neural network speech recognition systems. Real-time speech recognition has become an incredibly useful tool for solving a variety of problems in different areas of life. Many companies now offer dictation software that allows people to create search queries or dictate emails using voice commands. It is appropriate to consider neural network speech recognition, in particular, Ukrainian. One of the biggest problems faced by the analysis of Ukrainian speech is the limited number of models available for recognition. While there are many models for English, there are very few for Ukrainian. In general, the potential benefits of sound processing and speech recognition are obvious, and it is quite likely that we will continue to see new developments in these areas in the future. Neural networks are described, the principle of their operation and methods of audio recognition using them. The following results were obtained: the audio signal, its representation, statistical and physical methods of working with it were studied. Conclusion. Effective models for correct speech recognition and toolkits for model training were found. Метою даної роботи є дослідження підходів до створення систем нейромережевого розпізнавання мовлення. Розпізнавання мовлення в реальному часі стало неймовірно корисним інструментом для вирішення різноманітних проблем у різних сферах життя. Зараз багато компаній пропонують програмне забезпечення для диктування, яке дозволяє людям створювати пошукові запити або диктувати електронні листи за допомогою голосових команд. Доцільним є розгляд нейромережевого розпізнавання мови, зокрема, української. Однією з найбільших проблем, з якими стикається аналіз українського мовлення, є обмежена кількість моделей, доступних для розпізнавання. Якщо для англійської є багато моделей, то для української – їх зовсім мало. Загалом потенційні переваги обробки звуку та розпізнавання мовлення очевидні, і цілком імовірно, що ми продовжуватимемо бачити нові розробки в цих сферах у майбутньому. Описані нейромережі, принцип їх роботи та способи розпізнавання аудіо за допомогою них. Було отримано такі результати: досліджено аудіосигнал, його представлення, статистичні та фізичні методи роботи з ним. Висновок. Знайдено ефективні моделі для коректного розпізнавання мови та тулкіти для навчання моделі.
dc.identifier.citationInformation technologies of neural network speech recognition in real-time / I. Serdyuk [et al.] // Територія безпеки = Terra security. – 2025. – Т. 1, № 2. – С. 72-80.
dc.identifier.doihttps://doi.org/10.20998/3083-6298.2025.02.09
dc.identifier.orcidhttps://orcid.org/0009-0001-1143-9145
dc.identifier.orcidhttps://orcid.org/0009-0001-8498-0522
dc.identifier.orcidhttps://orcid.org/0000-0002-8927-7465
dc.identifier.orcidhttps://orcid.org/0009-0002-4310-2843
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/93724
dc.language.isoen
dc.publisherНаціональний технічний університет "Харківський політехнічний інститут"
dc.subjectneural networks
dc.subjectaudio signal processing
dc.subjectconvolutional neural network
dc.subjectgestalt grouping
dc.subjectcochlear model
dc.subjectdataset
dc.subjectнейронні мережі
dc.subjectобробка аудіосигналу
dc.subjectзгорткова нейромережа
dc.subjectгештальт-групування
dc.subjectкохлеарна модель
dc.subjectдатасет
dc.titleInformation technologies of neural network speech recognition in real-time
dc.title.alternativeІнформаційні технології нейромережевого розпізнавання мовлення в режимі реального часу
dc.typeArticle

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
TS_2025_2_Serdyuk_Information_technologies.pdf
Розмір:
512.3 KB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
license.txt
Розмір:
2.95 KB
Формат:
Item-specific license agreed upon to submission
Опис: