Автоматична ідентифікація музичних інструментів

Вантажиться...
Ескіз

Дата

Науковий ступінь

Рівень дисертації

Шифр та назва спеціальності

Рада захисту

Установа захисту

Науковий керівник/консультант

Члени комітету

Назва журналу

Номер ISSN

Назва тому

Видавець

Національний технічний університет "Харківський політехнічний інститут"

Анотація

У цій статті досліджується застосування перетворення Фур’є для автоматичного розпізнавання музичних інструментів в аудіозаписах. Зі зростанням складності музичних композицій та потребою в ефективній класифікації аудіо дослідження зосереджується на вилученні детальних спектральних характеристик із звукових сигналів за допомогою швидкого перетворення Фур’є (FFT). Ці характеристики включають спектральний центроїд, ширину смуги пропускання, спад, швидкість перетину нуля та кепстральні коефіцієнти Mel-Frequency (MFCC), які представляють частотні характеристики різних інструментів. Вилучені характеристики обробляються та використовуються для навчання моделей машинного навчання. Зокрема, у статті оцінюється продуктивність двох алгоритмів класифікації: методу апроксимації найближчого сусіда (ANN) та методу опорних векторів (SVM). Моделі навчаються на наборі даних коротких записів на одному інструменті та тестуються на зразках зі змішаних інструментів для оцінки можливостей узагальнення. Експериментальні результати показують, що обидві моделі можуть ефективно класифікувати інструменти з високою точністю – понад 96 % у контрольованих середовищах. This paper explores the application of the Fourier Transform for automatic musical instrument recognition in audio recordings. With the increasing complexity of musical compositions and the need for efficient audio classification, the study focuses on extracting detailed spectral features from sound signals using the Fast Fourier Transform (FFT). These features include spectral centroid, bandwidth, roll-off, zero-crossing rate, and Mel-Frequency Cepstral Coefficients (MFCCs), which represent the frequency-based characteristics of different instruments. The extracted features are processed and used to train machine learning models. Specifically, the paper evaluates the performance of two classification algorithms: Approximate Nearest Neighbor (ANN) and Support Vector Machine (SVM). The models are trained on a dataset of short mono-instrument recordings and tested on mixed-instrument samples to assess generalization capabilities. The experimental results demonstrate that both models can effectively classify instruments with high accuracy – over 96 % in controlled environments.

Опис

Ключові слова

перетворення Фур'є, спектральні характеристики, кепстральні коефіцієнти Mel-Frequency, аналіз сигналів, обробка аудіо, машинне навчання, метод опорних векторів, метод найближчого сусіда, Fourier transform, spectral features, Mel-Frequency Cepstral Coefficients, signal analysis, audio processing, machine learning, Support Vector Machine, Approximate Nearest Neighbor

Бібліографічний опис

Кузь В. В. Автоматична ідентифікація музичних інструментів / В. В. Кузь, А. В. Шатирко // Вісник Національного технічного університету "ХПІ". Серія: Математичне моделювання в техніці та технологіях = Bulletin of the National Technical University "KhPI". Series: Mathematical modeling in engineering and technologies : зб. наук. пр. – Харків : Стильна типографія, 2025. – № 2 (9). – С. 62-69.

Підтвердження

Рецензія

Додано до

Згадується в