Інформаційна технологія класифікації впорядкованих масивів даних із фрактальними властивостями методами машинного навчання

Вантажиться...
Ескіз

Дата

2021

ORCID

DOI

Науковий ступінь

кандидат технічних наук

Рівень дисертації

кандидатська дисертація

Шифр та назва спеціальності

05.13.06 – інформаційні технології

Рада захисту

Спеціалізована вчена рада Д 64.050.07

Установа захисту

Національний технічний університет "Харківський політехнічний інститут"

Науковий керівник

Кіріченко Людмила Олегівна

Члени комітету

Куценко Олександр Сергійович
Гамаюн Ігор Петрович
Дорофєєв Юрій Іванович

Видавець

Національний технічний університет "Харківський політехнічний інститут"

Анотація

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – інформаційні технології. – Національний технічний університет "Харківський політехнічний інститут", Харків, 2021 р. Дисертацію присвячено розробці інформаційної технології класифікації упорядкованих масивів даних (УМД), які мають фрактальні властивості, з використанням методів машинного навчання. В роботі програмно реалізовано методи генерації УМД з мультифрактальними властивостями різних типів. Здійснено чисельні експерименти, при виконанні яких проводилася класифікація різних типів упорядкованих даних, множина УМД розбивалась на класи за їхніми фрактальними властивостями. Як класифікатори застосовано ансамблеві методи дерев рішень та нейронні мережі, у якості ознак при класифікації використовувалися статистичні, фрактальні та рекурентні характеристики УМД. Дослідження показали, що діапазон мультифрактальних і самоподібних властивостей масивів даних відіграє важливе значення для вибору класифікатора і набору ознак, та, відповідно, точності класифікації. Якщо впорядковані дані характеризуються сильно вираженими мультифрактальними характеристиками, в більшості випадків достатньо використовувати значення УМД як ознаки при класифікації з використанням ансамблевих методів дерев рішень; також вони ефективно класифікуються за фрактальними характеристиками. Якщо УМД має монофрактальні властивості, то такі дані доцільно класифікувати з використанням рекурентних та фрактальних характеристик за допомогою нейронних мереж. Найбільш складним випадком є класифікація УМД, які мають слабо виражену мультифрактальність та слабку автокореляційну залежність. У цьому випадку пропонується застосувати ансамбль з використанням як окремих класифікаторів нейронних мереж та випадкового лісу, де в якості ознак використовуються фрактальні та рекурентні характеристики УМД. Розроблена технологія дозволяє використовувати її для обчислення показника Херста за часовими рядами та дозволяє зменшити довірчий інтервал оцінки показника Херста в декілька разів. Запропонована інформаційна технологія аналізує вхідний потік інформації та обирає набір характеристик класифікатора для максимізації точності класифікації УМД. Таким чином, інформаційна технологія дозволяє класифікувати дані з різними фрактальними властивостями, що дозволяє використовувати її для класифікації упорядкованих масивів даних різноманітної природи, наприклад, для виявлення DDoS-атак в інфокомунікаційних даних, уточнення діагнозу за записами електроенцефалограми та електрокардіографії, класифікації сейсмічних подій за сейсмограмами тощо.
Thesis for the degree of candidate of technical sciences in specialty 05.13.06 – information technologies. – National Technical University "Kharkiv Polytechnic Institute", Kharkiv, 2021. The thesis is devoted to the development of information technology for the classification of ordered data arrays (ODA), which have fractal properties, using machine learning methods. The methods for generating ODA with multifractal properties of various types are implemented in software. The series of experiments in which different types of ordered data split into classes according to their fractal properties were carried out. Ensemble methods of decision trees and neural networks were used as classifiers. The statistical, fractal and recurrence characteristics of ODA were used as features in the classification. Studies have shown that the range of multifractal and self-similar properties of data set plays an important role in the choice of a classifier and set of features, and, accordingly, classification accuracy. The proposed information technology analyzes the input information flow and selects classifier and features r to maximize the classification accuracy. The developed technology makes it possible to classify data with various fractal properties, for example, to detect DDoS attacks in infocommunication data, to clarify the diagnosis based on electroencephalogram and electrocardiography records, to classify seismic events for seismograms, etc.

Опис

Ключові слова

автореферат дисертації, класифікація, інформаційна технологія, машинне навчання, рекурентна діаграма, мультифрактальний процес, випадковий ліс, нейронна мережа, мультифрактальний аналіз, classification, information technology, machine learning, recurrent diagrams, multifractal processes, random forest, neural networks, multifractal analysis

Бібліографічний опис

Булах В. А. Інформаційна технологія класифікації впорядкованих масивів даних із фрактальними властивостями методами машинного навчання [Електронний ресурс] : автореф. дис. ... канд. техн. наук : спец. 05.13.06 / Віталій Анатолійович Булах ; [наук. керівник Кіріченко Л. О.] ; Нац. техн. ун-т "Харків. політехн. ін-т". – Харків, 2021. – 24 с. – Бібліогр.: с. 19-22. – укр.