Дисертації та автореферати
Постійне посилання на розділhttps://repository.kpi.kharkov.ua/handle/KhPI-Press/16999
Електронна повнотекстова колекція авторефератів та дисертацій, упорядкована за назвами спеціальностей
Переглянути
2 результатів
Результати пошуку
Документ Інформаційна технологія класифікації впорядкованих масивів даних із фрактальними властивостями методами машинного навчання(Національний технічний університет "Харківський політехнічний інститут", 2021) Булах, Віталій АнатолійовичДисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – "Інформаційні технології". – Міністерство освіти і науки України національний технічний университет "Харківський політехнічний інститут", 2021. Дисертаційна робота присвячена вирішенню задачі класифікації фрактальних упорядкованих масивів даних (УМД) в різноманітних сферах людської діяльності, наприклад в медицині при діагностиці захворювань по енцефалограмам, кардіограмам; при виявленні кризових ситуацій по біржовим індексам; виявлення вторгнень в комп’ютерну мережу та інше. Метою дисертаційної роботи є підвищення точності класифікації упорядкованих масивів даних із фрактальними властивостями шляхом створення інформаційної технології класифікації методами машинного навчання. Об’єкт дослідження – процес класифікації об’єктів методами машинного навчання. Предмет дослідження – методи та моделі класифікації фрактальних упорядкованих масивів даних. Методи дослідження. При вирішенні поставлених задач у роботі використовувався математичний апарат методів машинного навчання; методи математичної статистики – для статистичного аналізу упорядкованих масивів даних, аналізу точності класифікації методами машинного навчання; методи теорії хаоса та фрактального аналізу – для обчислення фрактальних та рекурентних характеристик. Наукова новизна отриманих результатів полягає у тому, що вперше встановлено наступне: – розроблено інформаційну технологію класифікації фрактальних упорядкованих масивів даних, яка заснована на поєднанні методів дерев рішень та нейронних мереж, враховує самоподібні та мультифрактальні властивості упорядкованих даних, що дозволяє збільшити точність класифікації; – запропоновано метод оцінювання показника Херста за значеннями часового ряду, який засновано на застосуванні класифікаційних методів машинного навчання, що дозволяє суттєво зменшити довірчий інтервал оцінки; – застосовані рекурентні характеристики часових рядів, як ознаки для класифікації часових рядів на основі їхніх фрактальних властивостей методами машинного навчання, дозволили збільшити точність класифікації. Подальший розвиток отримали: – метод генерації фрактальних реалізацій на основі стохастичного мультиплікативного біноміального каскаду, який на відміну від існуючих використовує аналітичне визначення параметрів несиметричного бета-розподілу, що дозволяє генерувати упорядковані масиви даних із заданими мультифрактальними властивостями; – методи бінарної класифікації часових рядів з фрактальними властивостями, що засновані на використанні дерев прийняття рішень та нейронних мереж, які на відміну від існуючих використовують як ознаки фрактальні та рекурентні характеристики, що дозволяє збільшити точність класифікації. Практичне значення отриманих результатів полягає у тому, що в результаті виконаного дисертаційного дослідження створено комплекс методів, алгоритмів і програм, які дозволяють вирішити завдання класифікації фрактальних упорядкованих масивів даних. Усі теоретичні розробки дисертації доведені автором до конкретних методів і покладені в основу функціонування інформаційної технології класифікації впорядкованих масивів даних із фрактальними властивостями методами машинного навчання. Запропонований метод оцінювання показника Херста, який програмно реалізований, дозволяє покращити точність його оцінювання за упорядкованими даними, а саме: зменшує довірчий інтервал оцінки в декілька разів. Проведений у роботі аналіз існуючих методів класифікації упорядкованих масивів даних показав: незважаючи на те, що застосування машинного навчання в задачах аналізу фрактальних даних постійно зростає, на сьогоднішній, день не розроблено інформаційної технології, яка призначена для задач класифікації фрактальних масивів даних, зокрема часових рядів. У роботі виконано огляд існуючих методів генерування фрактальних та мультифрактальних упорядкованих масивів даних. Доведена необхідність удосконалення таких методів, та запропоновано підхід до генерації стохастичного мультиплікативного біноміального каскаду на основі вирішення задачі нелінійної оптимізації. Розв’язання цієї задачі дозволяє використовувати несиметричний бета-розподіл для генерації стохастичного мультиплікативного біноміального каскаду, що дозволило охопити широкий спектр мультифрактальних властивостей. Використання удосконаленого методу генерації стохастичного мультиплікативного біноміального каскаду дає змогу генерувати більш складні у фрактальному сенсі реалізації мультифрактального броунівського руху. Проведено чисельні експерименти класифікації різних типів упорядкованих масивів даних, які були розбиті на класи за їхніми фрактальними властивостями. Були застосовані наступні методи класифікації: дерева прийняття рішень, bagging, випадковий ліс, багатошаровий персептрон, мережі довгої короткострокової пам’яті. Дослідження показали, що діапазон мультифрактальних і самоподібних властивостей відіграє важливу роль для вибору класифікатора, і відповідно на точність класифікації. Було доведено що використання статистичних та фрактальних характеристик мультифрактальних упорядкованих масивів даних дозволяє покращиті точність класифікації УМД порівняно з використанням значень УМД як ознак при класифікації. Розглянуто рекурентні діаграми та запропоновано використання їх характеристик в якості ознак при навчанні моделей класифікації. Дослідження показали що характеристики рекурентних діаграм дають суттєвий внесок в точність класифікації, та дозволяють класифікувати УМД з монофрактальними властивостями. Розроблена інформаційна технологія класифікації УМД, котра дозволяє підібрати оптимальний метод машинного навчання для класифікації досліджуваного упорядкованого масиву даних. Запропоновано використання розробленої інформаційної технології для визначення показника Херста УМД. Експериментально доведено ефективність використання методів машинного навчання для визначення показника Херста та його довірчого інтервалу, та дозволило скоротити довірчий інтервал показника Херста для фрактальних та мультифрактальних УМД більше ніж у 2 рази. Приведено результати застосування запропонованої інформаційної технології для виявлення DDoS-атак в комп’ютерній мережі. ІТ збільшує кількість виявлених атак, що дозволяє використовувати запропоновану ІТ як додатковий фільтр при виявленні DDoS-атак. Запропоновані у роботі моделі, методи та інформаційна технологія класифікації фрактальних даних були впроваджені у діяльність підприємств різних галузей економіки: – для підприємства ПрАт «Фарлеп-Інвест» (м. Харків) впроваджено розроблену інформаційну технологію для зменшення негативного впливу кібер-атак на інформаційні системи підприємства; – для підприємства КБ «ПриватБанк» (м. Харків) впроваджено розроблену інформаційну технологію для виявлення вторгнень в інформаційні системи підприємства. Результати дисертаційного дослідження впроваджені у навчальному процесі Харківському національному університеті радіоелектроніки на кафедрі інфокомунікаційної інженерії при викладанні навчальної дисципліни "Artificial Intelligence (Штучний інтелект)".Документ Інформаційна технологія класифікації впорядкованих масивів даних із фрактальними властивостями методами машинного навчання(Національний технічний університет "Харківський політехнічний інститут", 2021) Булах, Віталій АнатолійовичДисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – інформаційні технології. – Національний технічний університет "Харківський політехнічний інститут", Харків, 2021 р. Дисертацію присвячено розробці інформаційної технології класифікації упорядкованих масивів даних (УМД), які мають фрактальні властивості, з використанням методів машинного навчання. В роботі програмно реалізовано методи генерації УМД з мультифрактальними властивостями різних типів. Здійснено чисельні експерименти, при виконанні яких проводилася класифікація різних типів упорядкованих даних, множина УМД розбивалась на класи за їхніми фрактальними властивостями. Як класифікатори застосовано ансамблеві методи дерев рішень та нейронні мережі, у якості ознак при класифікації використовувалися статистичні, фрактальні та рекурентні характеристики УМД. Дослідження показали, що діапазон мультифрактальних і самоподібних властивостей масивів даних відіграє важливе значення для вибору класифікатора і набору ознак, та, відповідно, точності класифікації. Якщо впорядковані дані характеризуються сильно вираженими мультифрактальними характеристиками, в більшості випадків достатньо використовувати значення УМД як ознаки при класифікації з використанням ансамблевих методів дерев рішень; також вони ефективно класифікуються за фрактальними характеристиками. Якщо УМД має монофрактальні властивості, то такі дані доцільно класифікувати з використанням рекурентних та фрактальних характеристик за допомогою нейронних мереж. Найбільш складним випадком є класифікація УМД, які мають слабо виражену мультифрактальність та слабку автокореляційну залежність. У цьому випадку пропонується застосувати ансамбль з використанням як окремих класифікаторів нейронних мереж та випадкового лісу, де в якості ознак використовуються фрактальні та рекурентні характеристики УМД. Розроблена технологія дозволяє використовувати її для обчислення показника Херста за часовими рядами та дозволяє зменшити довірчий інтервал оцінки показника Херста в декілька разів. Запропонована інформаційна технологія аналізує вхідний потік інформації та обирає набір характеристик класифікатора для максимізації точності класифікації УМД. Таким чином, інформаційна технологія дозволяє класифікувати дані з різними фрактальними властивостями, що дозволяє використовувати її для класифікації упорядкованих масивів даних різноманітної природи, наприклад, для виявлення DDoS-атак в інфокомунікаційних даних, уточнення діагнозу за записами електроенцефалограми та електрокардіографії, класифікації сейсмічних подій за сейсмограмами тощо.