Оцінка інформативності та вибір ознак при ідентифікації стану комп'ютерної системи

Вантажиться...
Ескіз

Дата

2021

DOI

doi.org/10.20998/2522-9052.2021.2.01

Науковий ступінь

Рівень дисертації

Шифр та назва спеціальності

Рада захисту

Установа захисту

Науковий керівник

Члени комітету

Видавець

Національний технічний університет "Харківський політехнічний інститут"

Анотація

Предметом статті є дослідження методів визначення інформативності ознак. Метою статті є підвищення якості класифікації стану комп’ютерної системи за рахунок вибору найбільш інформативних ознак. Завдання: дослідити методи вибору оптимальних інформаційних ознак для ідентифікації стану комп’ютерної системи на основі аналізу подій операційної системи Windows. Використовуваними методами є: методи машинного навчання, ансамблеві методи, методи вибору оптимальних інформаційних ознак. Отримано такі результати: виконано аналіз подій операційної системи Windows, досліджено методи вибору оптимальних інформаційних ознак: методи-обгортки (Wrappers), вбудовані методи (Embedded) і методи-фільтри (Filters). Виконано оцінку інформативності та вибір ознак при ідентифікації стану комп’ютерної системи. Для оцінки ефективності вибраних ознак було використано ансамблевий метод класифікації стану комп’ютерної системи на основі беггінгу та дерева рішень J48. Досліджено залежність точності класифікації стану комп’ютерної системи від обраних ознак та визначено набір атрибутів, які забезпечують максимальну точність класифікації стану комп’ютерної системи. Висновки. Наукова новизна отриманих результатів полягає у аналізі подій операційної системи Windows, оцінці їх інформативності та вибору ознак при ідентифікації стану комп’ютерної системи.
The subject of the article is a study of methods of determining the informativeness of attributes. The aim of the article is improvement of the classification quality of a computer system state by selecting the most informative features. Objective: To explore methods for selecting optimal information features to identify a computer system state based on an analysis of the Windows operating system events. The methods used are: machine learning methods, ensemble methods, methods of selecting the optimal information features. The following results were obtained: analysis of the Windows operating system events was performed, methods of selection the optimal information features were investigated: wrapper methods (Wrappers), embedded methods (Embedded) and filter methods (Filters). The informativeness assessment and selection features were performed for identifying a computer system state. An ensemble method for classifying a computer system state based on a bagging and J48 decision tree was developed to evaluate the effectiveness of selected features. The dependency of the classification accuracy of a computer system state on the selected features was investigated, and the attributes set that provides the maximum classification accuracy of a computer system state was determined. Conclusions. The scientific novelty of the results is in the analysis of the Windows operating system events, assessment of their informativeness and selection of features in the identification a computer system state.

Опис

Ключові слова

дерева рішень, ансамблеві методи, беггінг, decision trees, ensemble methods, bagging

Бібліографічний опис

Гавриленко С. Ю. Оцінка інформативності та вибір ознак при ідентифікації стану комп'ютерної системи / С. Ю. Гавриленко, І. В. Шевердін, Г. В. Гейко // Сучасні інформаційні системи = Advanced Information Systems. – 2021. – Т. 5, № 2. – С. 5-12.