Application of heterogeneous ensembles in problems of computer system state identification

Вантажиться...
Ескіз

Дата

2023

DOI

https://doi.org/10.20998/2522-9052.2023.4.01

Науковий ступінь

Рівень дисертації

Шифр та назва спеціальності

Рада захисту

Установа захисту

Науковий керівник

Члени комітету

Видавець

Національний технічний університет "Харківський політехнічний інститут"

Анотація

The object of the study is the process of identifying anomalies in the operation of a computer system (CS). The subject of the study is ensemble methods for identifying the state of the CS. The goal of the study is to improve the performance of ensemble classifiers based on heterogeneous models. Methods used: machine learning methods, homogeneous and heterogeneous ensemble classifiers, Pasting and Bootstrapping technologies. Results obtained: a comparative analysis of the use of homogeneous and heterogeneous bagging ensembles in data classification problems was carried out. The effectiveness of various approaches to the selection of base ensemble classifiers has been studied. A method for identifying the state of a computer system, based on the heterogeneous bagging ensemble was proposed. Experimental studies made it possible to confirm the main theoretical assumptions, as well as evaluate the efficiency of the constructed heterogeneous ensembles. Conclusions. Based on the results of the study, the method for constructing a heterogeneous bagging ensemble classifier, which differs from known methods in the procedure for selecting base models was proposed. It made possible to increase the classification accuracy. Further development of this research could include the creating and integration of dissimilarity metrics as well as other quantitative metrics for a more accurate and balanced base model selection procedure, which would further improve the performance of the computer system state classifier.
Об'єктом дослідження є виявлення аномалій у роботі комп'ютерної системи. Предметом дослідження є ансамблеві методи ідентифікації стану КС. Метою дослідження є підвищення продуктивності ансамблевих класифікаторів на основі гетерогенних моделей. Методи, що використовуються: методи машинного навчання, гомогенні та гетерогенні ансамблеві класифікатори, технології Pasting та Bootstrapping. Отримані результати: проведено порівняльний аналіз використання гомогенних та гетерогенних беггінг ансамблів у задачах класифікації даних. Досліджено ефективність різних підходів щодо вибору базових класифікаторів ансамблю. Запропоновано метод ідентифікації стану комп'ютерної системи на основі гетерогенного беггінг ансамблю. Експериментальні дослідження дозволили підтвердити основні теоретичні припущення та оцінити ефективність роботи побудованих гетерогенних ансамблів. Висновки. За результатами дослідження запропоновано метод побудови гетерогенного ансамблевого класифікатора, який відрізняється від відомих методів процедурою вибору базових моделей. Це дозволило підвищити точність класифікації. Подальший розвиток цього дослідження може включати розробку та інтеграцію метрик несхожості, а також інших кількісних метрик для більш точної та збалансованої процедури відбору базових моделей, що сприятиме подальшому підвищенню ефективності роботи класифікатора стану комп'ютерної системи.

Опис

Ключові слова

computer system, anomaly detection, machine learning, bagging, homogeneous ensembles, heterogeneous ensembles, decision trees, k-nearest neighbors method, multilayer perceptron neural network, комп'ютерна система, виявлення аномалії, машинне навчання, беггінг, однорідні ансамблі, різнорідні ансамблі, дерева рішень, метод k-найближчих сусідів, багатошарова нейронна мережа перцептрона

Бібліографічний опис

Hornostal O. Application of heterogeneous ensembles in problems of computer system state identification / O. Hornostal, S. Gavrylenko // Сучасні інформаційні системи = Advanced Information Systems. – 2023. – Т. 7, № 4. – С. 5-12.