Метод підвищення оперативності класифікації даних за рахунок зменшення кореляції ознак
Вантажиться...
Дата
Науковий ступінь
Рівень дисертації
Шифр та назва спеціальності
Рада захисту
Установа захисту
Науковий керівник/консультант
Члени комітету
Назва журналу
Номер ISSN
Назва тому
Видавець
Національний університет "Полтавська політехніка імені Юрія Кондратюка"
Анотація
Об'єктом дослідження є процес ідентифікації стану комп'ютерної мережі. Предметом дослідження є методи ідентифікації стану комп’ютерних мереж. Метою статті є підвищення оперативності виявлення вторгнень у комп’ютерні мережі за рахунок зменшення кореляції ознак. Методи, що використовуються: методи штучного інтелекту, машинного навчання, методи зменшення кореляції ознак. Отримано такі результати: Досліджено ефективність використання підходів, які зменшують кореляцію даних: метод головних компонентів (PCA), незалежних компонентів (ICA), L1 та L2 регуляризацію, обґрунтовано метод для подальшого дослідження. За результатами досліджень запропоновано спеціальну процедуру зменшення кореляції вихідних даних. Для оцінки якості та оперативності запропонованої процедури, розроблено програмні моделі на основі: Gradient Boosting, Random Forest, повнозв’язної нейронної мережі (FCNN) та згорткової нейронної мережі (CNN). У якості вихідних даних використано набір UNSW NB 15, який містить інформацію про нормальне функціонування мережі та під час вторгнень. Виконано порівняльний аналіз якості та оперативності розроблених моделей. Висновки. Наукова новизна отриманих результатів полягає у розробці методу виявлення вторгнень в комп’ютерні мережі, який відрізняється від відомих наявністю спеціальної процедури зменшення кореляції вихідних даних, що дозволило підвищити оперативність процесу ідентифікації.
The object of the study is the process of identifying the state of the computer network. The subject of research is methods of identifying the state of computer networks. The purpose of the article is to increase the efficiency of detecting intrusions into computer networks by reducing the correlation of features. Methods used: methods of artificial intelligence, machine learning, methods of reducing the correlation of features. The following results were obtained: The effectiveness of using approaches that reduce data correlation was investigated: the method of principal components (PCA), independent components (ICA), L1 and L2 regularization, the method was justified for further research. According to the research results, a special procedure for reducing the correlation of the initial data is proposed. To evaluate the quality and efficiency of the proposed procedure, software models based on: Gradient Boosting, Random Forest, fully connected neural network (FCNN) and convolutional neural network (CNN) were developed. The UNSW-NB 15 set, which contains information on normal network functioning and during intrusions, was used as the source data. A comparative analysis of the quality and efficiency of the developed models was performed. Conclusions. The scientific novelty of the obtained results lies in the development of a method for detecting intrusions into computer networks, which differs from known methods by the presence of a special procedure for reducing the correlation of the output data, which made it possible to increase the efficiency of the identification process.
The object of the study is the process of identifying the state of the computer network. The subject of research is methods of identifying the state of computer networks. The purpose of the article is to increase the efficiency of detecting intrusions into computer networks by reducing the correlation of features. Methods used: methods of artificial intelligence, machine learning, methods of reducing the correlation of features. The following results were obtained: The effectiveness of using approaches that reduce data correlation was investigated: the method of principal components (PCA), independent components (ICA), L1 and L2 regularization, the method was justified for further research. According to the research results, a special procedure for reducing the correlation of the initial data is proposed. To evaluate the quality and efficiency of the proposed procedure, software models based on: Gradient Boosting, Random Forest, fully connected neural network (FCNN) and convolutional neural network (CNN) were developed. The UNSW-NB 15 set, which contains information on normal network functioning and during intrusions, was used as the source data. A comparative analysis of the quality and efficiency of the developed models was performed. Conclusions. The scientific novelty of the obtained results lies in the development of a method for detecting intrusions into computer networks, which differs from known methods by the presence of a special procedure for reducing the correlation of the output data, which made it possible to increase the efficiency of the identification process.
Опис
Ключові слова
машинне навчання, класифікація даних, попередня обробка даних, кореляція даних, комп'ютерні мережі, нейронні мережі, ансамблеві класифікатори, системи виявлення вторгнень, machine learning, data classification, data preprocessing, data correlation, computer networks, neural net works, ensemble classifiers, intrusion detection systems
Бібліографічний опис
Гавриленко С. Ю. Метод підвищення оперативності класифікації даних за рахунок зменшення кореляції ознак / С. Ю. Гавриленко, В. О. Полторацький // Системи управління, навігації та зв'язку. – 2023. – Вип. 4 (74). – С. 70-74.
