Класифікація мережевих атак методами машинного навчання в умовах дисбалансу тренувальних даних

Горносталь, Олексій Андрійович; Челак, Віктор Володимирович

doi:https://doi.org/10.26906/SUNZ.2025.3.64-71

Класифікація мережевих атак методами машинного навчання в умовах дисбалансу тренувальних даних

dc.contributor.author	Горносталь, Олексій Андрійович
dc.contributor.author	Челак, Віктор Володимирович
dc.date.accessioned	2026-01-16T08:59:41Z
dc.date.issued	2025
dc.description.abstract	Об'єктом дослідження є процес виявлення мережевих вторгнень. Предметом дослідження є методи класифікації мережевих вторгнень. Метою дослідження є підвищення якості та швидкості ансамблевих класифікаторів в задачах класифікації мережевих вторгнень в умовах дисбалансу тренувальних даних. Методи, що використовуються: методи машинного навчання, методи попередньої обробки даних, ансамблеві класифікатори, метод перебалансування шляхом синтетичного збільшення меншості (SMOTE). Отримані результати: досліджено ефективність використання різних підходів для класифікації мережевих вторгнень в умовах дисбалансу класів у тренувальній вибірці. Запропоновано комплексний підхід, що передбачає попередню обробку даних за допомогою методу SMOTE для синтетичного балансування навчальної вибірки, а також його подальший аналіз з використанням ансамблевих моделей машинного навчання, що дало змогу покращити показники класифікації міноритарних класів. Най кращі результати отримано при поєднанні SMOTE з ансамблевими моделями, зокрема Bagging, Gradient Boosting та AdaBoost. Висновки. За результатами дослідження запропоновано удосконалений підхід до класифікації мережевого трафіку, який поєднує попереднє балансування вибірки методом SMOTE з ансамблевими алгоритмами беггінг та бустинг. Комплексне використання цих методів дозволило покращити значення метрики Recall для міноритарних класів. Загалом запропонований підхід забезпечив покращення якості класифікації: 18% для атак типу Infiltration, 33% для атак з використанням SQL-ін’єкцій та до 53% для атак XSS у порівнянні з базовими моделями машинного навчання без додаткового перебалансування вхідних даних. The object of the research is the process of detecting network intrusions. The subject of the research is methods for classifying network intrusions. The aim of the research is to improve the quality and speed of ensemble classifiers in network intrusion classification problems under conditions of imbalance in training data. Methods used: machine learning methods, data preprocessing methods, ensemble classifiers, rebalancing method by synthetic minority augmentation. Results obtained: the effectiveness of using various approaches for classifying network intrusions under conditions of class imbalance in the training sample was investigated. A comprehensive approach was proposed, which involves preprocessing data using the SMOTE method for synthetic balancing of the training sample, as well as its subsequent analysis using ensemble machine learning models, which made it possible to improve the classification performance of minority classes. The best results were obtained when combining SMOTE with ensemble models, in particular Bagging, Gradient Boosting and AdaBoost. Conclusions. Based on the results of the study, an improved approach to network traffic classification was proposed, which combines pre-sampling by the SMOTE method with ensemble algorithms bagging and boosting. The combined use of these methods allowed to improve the value of the Recall metric for minority classes. Overall, the proposed approach provided an improvement in the classification quality: 18% for the Infiltration attack, 33% for the SQL Injection attack and up to 53% for the XSS attack compared to basic machine learning models without additional rebalancing of input data.
dc.identifier.citation	Горносталь О. А. Класифікація мережевих атак методами машинного навчання в умовах дисбалансу тренувальних даних / О. А. Горносталь, В. В. Челак // Системи управління, навігації та зв'язку = Control, navigation and communication systems : зб. наук. пр. / гол. ред. В. В. Косенко ; Полт. нац. техн. ун-т ім. Юрія Кондратюка. – Полтава : ПНТУ, 2025. – Вип. 3 (81). – С. 64-71.
dc.identifier.doi	https://doi.org/10.26906/SUNZ.2025.3.64-71
dc.identifier.orcid	https://orcid.org/0000-0001-5820-9999
dc.identifier.orcid	https://orcid.org/0000-0001-8810-3394
dc.identifier.uri	https://repository.kpi.kharkov.ua/handle/KhPI-Press/97592
dc.language.iso	uk
dc.publisher	Національний університет “Полтавська політехніка імені Юрія Кондратюка”
dc.subject	мережеві атаки
dc.subject	класифікація
dc.subject	машинне навчання
dc.subject	ансамблі
dc.subject	беггінг
dc.subject	бустинг
dc.subject	показники якості
dc.subject	SMOTE
dc.subject	network attacks
dc.subject	classification
dc.subject	machine learning
dc.subject	ensembles
dc.subject	bagging
dc.subject	boosting
dc.subject	quality metrics
dc.subject	SMOTE
dc.title	Класифікація мережевих атак методами машинного навчання в умовах дисбалансу тренувальних даних
dc.title.alternative	Classification of network attacks using machine learning methods in conditions of training data imbalance
dc.type	Article

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: SUNZ_2025_3_Hornostal_Klasyfikatsiia_merezhevykh.pdf
Розмір:: 920,26 KB
Формат:: Adobe Portable Document Format

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 11,15 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Колекції

Кафедра "Комп'ютерна інженерія та програмування"