Analysis of the sound event detection methods and systems

dc.contributor.authorKovalenko, Andriyen
dc.contributor.authorPoroshenko, Antonen
dc.date.accessioned2022-06-14T14:58:14Zen
dc.date.available2022-06-14T14:58:14Zen
dc.date.issued2022
dc.description.abstractDetection and recognition of loud sounds and characteristic noises can significantly increase the level of safety and ensure timely response to various emergency situations. Audio event detection is the first step in recognizing audio signals in a continuous audio input stream. This article presents a number of problems that are associated with the development of sound event detection systems, such as the deviation for each environment and each sound category, overlapping audio events, unreliable training data, etc. Both methods for detecting monophonic impulsive audio event and polyphonic sound event detection methods which are used in the state-of-the-art sound event detection systems are presented. Such systems are presented in Detection and Classification of Acoustic Scenes and Events (DCASE) challenges and workshops, which take place every year. Beside a majority of works focusing on the improving overall performance in terms of accuracy many other aspects have also been studied. Several systems presented at DCASE 2021 task 4 were considered, and based on their analysis, there was a conclusion about possible future for sound event detection systems. Also the actual directions in the development of modern audio analytics systems are presented, including the study and use of various architectures of neural networks, the use of several data augmentation techniques, such as universal sound separation, etc.en
dc.description.abstractВиявлення та розпізнавання гучних звуків і характерних шумів дозволяє значно підвищити рівень безпеки та забезпечити своєчасне реагування на різні аварійні ситуації. Детектування аудіоподій – це перший крок у розпізнаванні аудіосигналів з безперервним вхідним аудіопотоком. У даній статті представлено ряд проблем, пов'язаних з розробкою систем виявлення аудіоподій таких, як відхилення для кожного середовища і кожної звукової категорії, звукові події, що перекриваються, недостовірні навчальні дані та ін. Представлені, як методи виявлення монофонічних імпульсних звукових подій, так і методи виявлення поліфонічних аудіоподій, які використовуються в сучасних системах виявлення звукових подій. Такі системи представлені у завданнях та семінарах Detection and Classification of Acoustic Scenes and Events (DCASE), які відбуваються щороку. Більшість робіт спрямовані на покращення загальної продуктивності з точки зору точності, хоча також були вивчені багато інших аспектів. Було розглянуто кілька систем, представлених на DCASE 2021 в задачі 4, і на основі їх аналізу був зроблений висновок про можливе майбутнє систем виявлення звукових подій. Також представлені актуальні напрямки розвитку сучасних систем аудіоаналітики, в тому числі вивчення та використання різних архітектур нейронних мереж, використання декількох методів попередньої обробки даних, таких як універсальний розділ звуку та ін.uk
dc.identifier.citationKovalenko A. Analysis of the sound event detection methods and systems / A. Kovalenko, A. Poroshenko // Сучасні інформаційні системи = Advanced Information Systems. – 2022. – Т. 6, № 1. – С. 65-69.en
dc.identifier.doidoi.org/10.20998/2522-9052.2022.1.11en
dc.identifier.orcidhttps://orcid.org/0000-0002-2817-2836en
dc.identifier.orcidhttps://orcid.org/0000-0001-7266-4269en
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/57235en
dc.language.isoenen
dc.publisherНаціональний технічний університет "Харківський політехнічний інститут"uk
dc.subjectsound event detectionen
dc.subjectsound event recognitionen
dc.subjectmonophonic soundsen
dc.subjectpolyphonic soundsen
dc.subjectstandard deviationen
dc.subjectmedian filteren
dc.subjectdynamic thresholden
dc.subjectsound separationen
dc.subjectвиявлення звукових подійuk
dc.subjectрозпізнавання звукових подійuk
dc.subjectмонофонічні звукиuk
dc.subjectполіфонічні звукиuk
dc.subjectсередньоквадратичне відхиленняuk
dc.subjectмедіанний фільтрuk
dc.subjectдинамічний порігuk
dc.subjectзвуковий поділuk
dc.titleAnalysis of the sound event detection methods and systemsen
dc.title.alternativeАналіз методів та систем детектування аудіоподійuk
dc.typeArticleen

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Ескіз
Назва:
AIS_2022_6_1_Kovalenko_Analysis_of_the_sound.pdf
Розмір:
223.94 KB
Формат:
Adobe Portable Document Format
Опис:

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
11.25 KB
Формат:
Item-specific license agreed upon to submission
Опис: