Класифікація мережевих атак методами машинного навчання в умовах дисбалансу тренувальних даних
| dc.contributor.author | Горносталь, Олексій Андрійович | |
| dc.contributor.author | Челак, Віктор Володимирович | |
| dc.date.accessioned | 2026-01-16T08:59:41Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Об'єктом дослідження є процес виявлення мережевих вторгнень. Предметом дослідження є методи класифікації мережевих вторгнень. Метою дослідження є підвищення якості та швидкості ансамблевих класифікаторів в задачах класифікації мережевих вторгнень в умовах дисбалансу тренувальних даних. Методи, що використовуються: методи машинного навчання, методи попередньої обробки даних, ансамблеві класифікатори, метод перебалансування шляхом синтетичного збільшення меншості (SMOTE). Отримані результати: досліджено ефективність використання різних підходів для класифікації мережевих вторгнень в умовах дисбалансу класів у тренувальній вибірці. Запропоновано комплексний підхід, що передбачає попередню обробку даних за допомогою методу SMOTE для синтетичного балансування навчальної вибірки, а також його подальший аналіз з використанням ансамблевих моделей машинного навчання, що дало змогу покращити показники класифікації міноритарних класів. Най кращі результати отримано при поєднанні SMOTE з ансамблевими моделями, зокрема Bagging, Gradient Boosting та AdaBoost. Висновки. За результатами дослідження запропоновано удосконалений підхід до класифікації мережевого трафіку, який поєднує попереднє балансування вибірки методом SMOTE з ансамблевими алгоритмами беггінг та бустинг. Комплексне використання цих методів дозволило покращити значення метрики Recall для міноритарних класів. Загалом запропонований підхід забезпечив покращення якості класифікації: 18% для атак типу Infiltration, 33% для атак з використанням SQL-ін’єкцій та до 53% для атак XSS у порівнянні з базовими моделями машинного навчання без додаткового перебалансування вхідних даних. The object of the research is the process of detecting network intrusions. The subject of the research is methods for classifying network intrusions. The aim of the research is to improve the quality and speed of ensemble classifiers in network intrusion classification problems under conditions of imbalance in training data. Methods used: machine learning methods, data preprocessing methods, ensemble classifiers, rebalancing method by synthetic minority augmentation. Results obtained: the effectiveness of using various approaches for classifying network intrusions under conditions of class imbalance in the training sample was investigated. A comprehensive approach was proposed, which involves preprocessing data using the SMOTE method for synthetic balancing of the training sample, as well as its subsequent analysis using ensemble machine learning models, which made it possible to improve the classification performance of minority classes. The best results were obtained when combining SMOTE with ensemble models, in particular Bagging, Gradient Boosting and AdaBoost. Conclusions. Based on the results of the study, an improved approach to network traffic classification was proposed, which combines pre-sampling by the SMOTE method with ensemble algorithms bagging and boosting. The combined use of these methods allowed to improve the value of the Recall metric for minority classes. Overall, the proposed approach provided an improvement in the classification quality: 18% for the Infiltration attack, 33% for the SQL Injection attack and up to 53% for the XSS attack compared to basic machine learning models without additional rebalancing of input data. | |
| dc.identifier.citation | Горносталь О. А. Класифікація мережевих атак методами машинного навчання в умовах дисбалансу тренувальних даних / О. А. Горносталь, В. В. Челак // Системи управління, навігації та зв'язку = Control, navigation and communication systems : зб. наук. пр. / гол. ред. В. В. Косенко ; Полт. нац. техн. ун-т ім. Юрія Кондратюка. – Полтава : ПНТУ, 2025. – Вип. 3 (81). – С. 64-71. | |
| dc.identifier.doi | https://doi.org/10.26906/SUNZ.2025.3.64-71 | |
| dc.identifier.orcid | https://orcid.org/0000-0001-5820-9999 | |
| dc.identifier.orcid | https://orcid.org/0000-0001-8810-3394 | |
| dc.identifier.uri | https://repository.kpi.kharkov.ua/handle/KhPI-Press/97592 | |
| dc.language.iso | uk | |
| dc.publisher | Національний університет “Полтавська політехніка імені Юрія Кондратюка” | |
| dc.subject | мережеві атаки | |
| dc.subject | класифікація | |
| dc.subject | машинне навчання | |
| dc.subject | ансамблі | |
| dc.subject | беггінг | |
| dc.subject | бустинг | |
| dc.subject | показники якості | |
| dc.subject | SMOTE | |
| dc.subject | network attacks | |
| dc.subject | classification | |
| dc.subject | machine learning | |
| dc.subject | ensembles | |
| dc.subject | bagging | |
| dc.subject | boosting | |
| dc.subject | quality metrics | |
| dc.subject | SMOTE | |
| dc.title | Класифікація мережевих атак методами машинного навчання в умовах дисбалансу тренувальних даних | |
| dc.title.alternative | Classification of network attacks using machine learning methods in conditions of training data imbalance | |
| dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- SUNZ_2025_3_Hornostal_Klasyfikatsiia_merezhevykh.pdf
- Розмір:
- 920.26 KB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Вантажиться...
- Назва:
- license.txt
- Розмір:
- 11.15 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис:
