Please use this identifier to cite or link to this item: http://repository.kpi.kharkov.ua/handle/KhPI-Press/51834
Title: Інформаційна технологія класифікації впорядкованих масивів даних із фрактальними властивостями методами машинного навчання
Other Titles: Information technology of classification of ordered data arrays with fractal properties using machine learning methods
Authors: Булах, Віталій Анатолійович
Science degree: кандидат технічних наук
Thesis level: кандидатська дисертація
Code and name of the discipline: 05.13.06 – інформаційні технології
Thesis department: Спеціалізована вчена рада Д 64.050.07
Thesis grantor: Національний технічний університет "Харківський політехнічний інститут"
Scientific advisor: Кіріченко Людмила Олегівна
Committee members: Куценко Олександр Сергійович
Гамаюн Ігор Петрович
Дорофєєв Юрій Іванович
Keywords: автореферат дисертації; класифікація; інформаційна технологія; машинне навчання; рекурентна діаграма; мультифрактальний процес; випадковий ліс; нейронна мережа; мультифрактальний аналіз; classification; information technology; machine learning; recurrent diagrams; multifractal processes; random forest; neural networks; multifractal analysis
УДК: 004.9; 519.2
Issue Date: 2021
Publisher: Національний технічний університет "Харківський політехнічний інститут"
Citation: Булах В. А. Інформаційна технологія класифікації впорядкованих масивів даних із фрактальними властивостями методами машинного навчання [Електронний ресурс] : автореф. дис. ... канд. техн. наук : спец. 05.13.06 / Віталій Анатолійович Булах ; [наук. керівник Кіріченко Л. О.] ; Нац. техн. ун-т "Харків. політехн. ін-т". – Харків, 2021. – 24 с. – Бібліогр.: с. 19-22. – укр.
Abstract: Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – інформаційні технології. – Національний технічний університет "Харківський політехнічний інститут", Харків, 2021 р. Дисертацію присвячено розробці інформаційної технології класифікації упорядкованих масивів даних (УМД), які мають фрактальні властивості, з використанням методів машинного навчання. В роботі програмно реалізовано методи генерації УМД з мультифрактальними властивостями різних типів. Здійснено чисельні експерименти, при виконанні яких проводилася класифікація різних типів упорядкованих даних, множина УМД розбивалась на класи за їхніми фрактальними властивостями. Як класифікатори застосовано ансамблеві методи дерев рішень та нейронні мережі, у якості ознак при класифікації використовувалися статистичні, фрактальні та рекурентні характеристики УМД. Дослідження показали, що діапазон мультифрактальних і самоподібних властивостей масивів даних відіграє важливе значення для вибору класифікатора і набору ознак, та, відповідно, точності класифікації. Якщо впорядковані дані характеризуються сильно вираженими мультифрактальними характеристиками, в більшості випадків достатньо використовувати значення УМД як ознаки при класифікації з використанням ансамблевих методів дерев рішень; також вони ефективно класифікуються за фрактальними характеристиками. Якщо УМД має монофрактальні властивості, то такі дані доцільно класифікувати з використанням рекурентних та фрактальних характеристик за допомогою нейронних мереж. Найбільш складним випадком є класифікація УМД, які мають слабо виражену мультифрактальність та слабку автокореляційну залежність. У цьому випадку пропонується застосувати ансамбль з використанням як окремих класифікаторів нейронних мереж та випадкового лісу, де в якості ознак використовуються фрактальні та рекурентні характеристики УМД. Розроблена технологія дозволяє використовувати її для обчислення показника Херста за часовими рядами та дозволяє зменшити довірчий інтервал оцінки показника Херста в декілька разів. Запропонована інформаційна технологія аналізує вхідний потік інформації та обирає набір характеристик класифікатора для максимізації точності класифікації УМД. Таким чином, інформаційна технологія дозволяє класифікувати дані з різними фрактальними властивостями, що дозволяє використовувати її для класифікації упорядкованих масивів даних різноманітної природи, наприклад, для виявлення DDoS-атак в інфокомунікаційних даних, уточнення діагнозу за записами електроенцефалограми та електрокардіографії, класифікації сейсмічних подій за сейсмограмами тощо.
Thesis for the degree of candidate of technical sciences in specialty 05.13.06 – information technologies. – National Technical University "Kharkiv Polytechnic Institute", Kharkiv, 2021. The thesis is devoted to the development of information technology for the classification of ordered data arrays (ODA), which have fractal properties, using machine learning methods. The methods for generating ODA with multifractal properties of various types are implemented in software. The series of experiments in which different types of ordered data split into classes according to their fractal properties were carried out. Ensemble methods of decision trees and neural networks were used as classifiers. The statistical, fractal and recurrence characteristics of ODA were used as features in the classification. Studies have shown that the range of multifractal and self-similar properties of data set plays an important role in the choice of a classifier and set of features, and, accordingly, classification accuracy. The proposed information technology analyzes the input information flow and selects classifier and features r to maximize the classification accuracy. The developed technology makes it possible to classify data with various fractal properties, for example, to detect DDoS attacks in infocommunication data, to clarify the diagnosis based on electroencephalogram and electrocardiography records, to classify seismic events for seismograms, etc.
URI: http://repository.kpi.kharkov.ua/handle/KhPI-Press/51834
Appears in Collections:05.13.06 "Інформаційні технології"

Files in This Item:
File Description SizeFormat 
avtoreferat_2021_Bulakh_Informatsiina_tekhnolohiia.pdf741,41 kBAdobe PDFThumbnail
View/Open
Show full item record  Google Scholar



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.