Дисертації та автореферати

Постійне посилання на розділhttps://repository.kpi.kharkov.ua/handle/KhPI-Press/16999

Електронна повнотекстова колекція авторефератів та дисертацій, упорядкована за назвами спеціальностей

Переглянути

Результати пошуку

Зараз показуємо 1 - 7 з 7

Методи обробки мультиспектральних зображень в комп'ютеризованій системі на основі нейронних мереж глибокого навчання
(Національний технічний університет "Харківський політехнічний інститут", 2024) Яловега, Владислав Анатолійович
Дисертація на здобуття наукового ступеня доктора філософії (PhD) за спеціальністю 123 – Комп’ютерна інженерія. – Національний технічний університет «Харківський політехнічний інститут», Харків, 2024. Дисертаційна робота присвячена вирішенню актуальної науково-технічної задачі обробки мультиспектральних супутникових зображень на основі нейронних мереж глибокого навчання у комп’ютеризованій системі з метою підвищення ефективності та якості роботи рішень, що матимуть можливість отримання оперативної інформації про об’єкти земної поверхні під час проведення дистанційного зондування земної поверхні. Метою дисертаційної роботи є підвищення якості класифікації оперативної інформації про об’єкти земної поверхні при проведенні дистанційного зондування за рахунок розробки нових та удосконалення існуючих методів класифікації мультиспектральних супутникових зображень на основі методів глибокого навчання. Об’єкт дослідження – процес класифікації мультиспектральних супутникових зображень дистанційного зондування земної поверхні в комп’ютеризованій системі. Предмет дослідження – методи та засоби багатокласової класифікації на основі методів глибокого навчання. У вступі обґрунтовано актуальність науково-технічної проблеми обробки мультиспектральних зображень земного покриву в комп’ютеризованих системах, представлено зв’язок роботи з науковими програмами, планами і темами, наведено наукову новизну, представлено практичне значення отриманих результатів, надано інформацію щодо особистого внеску здобувача, представлено перелік публікацій за темою дисертації. У першому розділі на основі аналітичного огляду виконано постановку науково-технічної задачі обробки мультиспектральних супутникових зображень у комп’ютеризованій системі. Досліджено основні причини та фактори необхідності спостереження за зміною земної поверхні та обробки даних дистанційного зондування Землі. Досліджено класичні методи на основі машинного навчання та методи на основі глибокого навчання для задач класифікації зображень. Проведено дослідження та порівняльний аналіз методів класифікації мультиспектральних супутникових зображень земного покриву. Обґрунтовано вибір методів для подальшого дослідження. Сформульовано завдання дисертаційного дослідження. У другому розділі виконана постановка задачі багатокласової класифікації мультиспектральних супутникових зображень у комп’ютеризованій системі на основі нейронних мереж глибокого навчання. Досліджено сучасні набори даних дистанційного зондування Землі. Розроблено метод багатокласової класифікації мультиспектральних зображень зі спектральними індексами на основі згорткової нейронної мережі визначеної архітектури, що дозволило підвищити точність класифікації об’єктів для набору даних EuroSAT. У третьому розділі отримав подальший розвиток метод багатокласової класифікації мультиспектральних зображень на основі згорткової нейронної мережі зі спектральними індексами шляхом оптимізації запропонованої процедури етапів структурного та параметричного налаштування, що з одного боку дозволило підвищити результуючі метрики оцінки якості класифікації супутникових зображень згортковою нейронною мережею, а з іншого – врахувати наявні ресурсні обмеження. Проведено порівняльне дослідження з відомими методами класифікації. Удосконалений метод зменшує кількість необхідних епох для навчання оптимізованої моделі згорткової нейронної мережі та значно підвищує метрики оцінки якості моделі нейронної мережі. У четвертому розділі удосконалено метод багатокласової класифікації мультиспектральних супутникових зображень земного покриву високої розрізнювальної здатності на основі запропонованого набору даних EuroPlanet. Запропоновано та розроблено процедуру фільтрації високоякісних супутникових зображень. Проведено валідацію EuroPlanet на основі сучасних наперед навчених нейронних мереж: Res-Net50v2, EfficientNetV2, Xception, VGG-16 та DenseNet201. Отримано, що попередньо навчена нейронна мережа DenseNet201 перевершує інші розглянуті моделі за значеннями метрик оцінки якості моделей нейронних мереж. Отримано оптимальну конфігурацію (RG+GNDVI) спектральних індексів. Досліджено вплив коефіцієнту поділу набору даних на навчальну та тестову підвибірки на метрики оцінки якості моделі нейронної мережі. Показано можливість застосування запропонованого методу для моніторингу змін земної поверхні території України, який може бути впроваджений у системи підтримки прийняття рішень. Проведені експерименти та порівняльні дослідження з відомими методами підтвердили ефективність запропонованого методу класифікації мультиспектральних зображень земного покриву, що дає змогу рекомендувати його для практичного використання. У висновках наведено основні результати досліджень, виконаних у дисертаційній роботі відповідно до поставлених наукових задач. За результатами дисертаційного дослідження отримано такі наукові результати: 1. Вперше запропоновано метод багатокласової класифікації мультиспектральних супутникових зображень земного покриву, який відрізняється від відомих процедурою пошуку оптимального набору спектральних індексів на основі вперше запропонованої архітектури згорткової нейронної мережі в комп’ютеризованій системі, що дозволило підвищити точність класифікації об’єктів земної поверхні. 2. Отримав подальший розвиток метод оптимізації згорткових нейронних мереж для задачі багатокласової класифікації супутникових зображень земного покриву за рахунок запропонованої процедури проведення оптимізації етапами структурного та параметричного налаштування при заданих бюджетних обмеженнях, що з одного боку дозволило підвищити результуючі метрики оцінки якості класифікації супутникових зображень згортковою нейронною мережею, а з іншого – врахувати наявні ресурсні обмеження. 3. Удосконалено метод багатокласової класифікації мультиспектральних супутникових зображень земного покриву високої розрізнювальної здатності, який відрізняється від відомих трансферним навчанням згорткових нейронних мереж на основі запропонованого набору даних EuroPlanet високої роздільної здатності та пошуком оптимальної конфігурації спектральних індексів, що дозволило підвищити точність класифікації даних дистанційного зондування земної поверхні та ефективність роботи моделі нейронної мережі й на території України. Розроблені та удосконалені методи є науково-методичною основою розробки алгоритмів та програмного забезпечення, практичне значення яких полягає в таких аспектах: −розроблено метод та програмне забезпечення побудови згорткової нейронної мережі для задачі багатокласової класифікації мультиспектральних супутникових зображень із оптимальним набором спектральних індексів, що дозволяє підвищити точність класифікації до 84,19% та метрику F1 до 84,05%; −отримав подальший розвиток метод та розроблено програмне забезпечення для оптимізації згорткових нейронних мереж задачі класифікації супутникових зображень земної поверхні, що покращило точність класифікації та метрику оцінки якості нейронних моделей F1 до 97.04% та до 97.05% відповідно, а для класів Herbaceous Vegetation, Permanent Crop, та Highway метрика F1 на тестовому наборі даних зросла до 20%. До того ж, використання сучасного фреймворку Ray Tune дозволило ефективно використати наявні ресурси з огляду визначених бюджетних обмежень; −розроблено процедуру фільтрації якісних супутникових зображень високої роздільної здатності, що пришвидшило й автоматизувало формування набору даних EuroPlanet у комп’ютеризованій системі; удосконалено метод та розроблене програмне забезпечення багатокласової класифікації зображень земного покриву набору даних EuroPlanet високої роздільної здатності та з оптимальною конфігурацією спектральних індексів. Точність класифікації на тестових даних склала 93,83%, а метрика F1 зросла до 93,56%. Показано можливість практичного застосування удосконаленого метода. За результатами дослідження підтверджено теоретичну та практичну цінність розроблених методів та процедур, надано практичні рекомендації щодо їх застосування в умовах повномасштабного російського вторгнення в Україну та розглянуто перспективи подальшого розвитку запропонованих методів. The thesis is submitted to obtain a scientific degree of Doctor of Philosophy, specialty 123 – Computer Engineering. – National Technical University “Kharkiv Polytechnic Institute”, Kharkiv, 2024. The dissertation work is devoted to the solution of an actual scientific and technical problem of multispectral satellite images processing based on deep learning neural networks in a computerized system to increase the performance and solutions quality that will have the possibility of obtaining actual information about Earth's surface objects during Earth remote sensing. The purpose of the dissertation is to increase the classification quality of actual information about Earth's surface objects during remote sensing by developing new and improving existing multispectral satellite images classification methods based on deep learning methods. The object of research is the process of Earth remote sensing multispectral satellite images multiclass classification in a computer system. The subject of research is methods and means of multiclass classification in a computer system based on deep learning methods. The introduction substantiates the relevance of a scientific and technical problem of Earth's surface multispectral images processing in a computerized system, presents the connection of the work with scientific programs, plans, and topics, provides scientific novelty, presents the practical significance of the obtained results and provides the applicant personal contribution information with publications on the topic of the dissertation. In the first chapter, the scientific and technical problem of multispectral satellite images processing in a computerized system is formulated based on analytical overview. The main reasons and factors of the necessity of Earth's surface change observing and processing the Earth's remote sensing data have been studied. Classic methods based on machine learning and methods based on deep learning for image classification problems have been studied. A study and comparative analysis of Earth's surface multispectral satellite images classification methods have been carried out. The choice of methods for further research is justified. The scientific objectives of the dissertation research are formulated. In the second chapter, a statement of the multispectral satellite images multiclass classification problem in a computer system based on deep learning neural networks is formulated. Modern Earth remote sensing datasets were studied. A method of multispectral multiclass images classification with spectral indices based on a defined convolutional neural network architecture has been developed which increased the object classification accuracy for the EuroSAT dataset. In the third chapter, the method of multispectral multiclass images classification based on a convolutional neural network with spectral indices was improved by optimizing the proposed procedure of rough-tuning and fine-tuning stages, which on the one hand increased the satellite images classification quality result metrics of a convolutional neural network, and on the other hand, considered existing resource limitations. A comparative study with known classification methods was conducted. The improved method reduces the number of required epochs for training the optimized convolutional neural network model and significantly increases the model evaluation metrics. In the fourth chapter, a high-resolution multispectral multiclass satellite land cover images classification method was improved based on the proposed high-resolution EuroPlanet dataset. A procedure for filtering high-resolution high-quality satellite images is proposed and developed. Validation of the EuroPlanet dataset was carried out based on modern pre-trained neural networks such as Res-Net50v2, EfficientNetV2, Xception, VGG-16, and DenseNet201. It was found that the pre-trained DenseNet201 neural network outperforms the other considered models in terms of the neural network quality metrics. The optimal spectral indexes configuration (RG+GNDVI) for EuroPlanet was obtained. The influence of the train test dataset split rate was studied. It is shown the possibility of using the proposed method for monitoring the Earth's surface changes on the Ukrainian territory and can be implemented in decision support systems. Conducted experiments and comparative studies with known methods confirmed the performance of the proposed Earth's cover multispectral images classification method, which makes it possible to use it in practical applications. The conclusions present the main results of the scientific work on solving the scientific objectives of the study. The scientific novelty of the results. As a result of the dissertation work, the following scientific results were obtained within this area: 1. For the first time, a method of Earth's surface multispectral satellite multiclass classification images is proposed, which differs from the known procedure of finding the optimal set of spectral indexes based on the proposed architecture of a convolutional neural network in a computerized system, which increased the Earth's surface objects classification accuracy. 2. The method of multispectral multiclass images classification based on a convolutional neural network with spectral indexes has been improved by optimizing the proposed procedure of rough-tuning and fine-tuning stages under given budget restrictions, which on the one hand increased the satellite images classification quality result metrics of a convolutional neural network, and on the other hand, considered existing resource limitations. 3. The method of Earth's cover high-resolution multispectral satellite multiclass classification images was improved, which differs from the known by transfer learning of convolutional neural networks based on the proposed high-resolution EuroPlanet dataset and the optimal spectral indexes configuration and made increased the Earth remote sensing data classification accuracy and the neural network model performance on the Ukrainian territory. The developed and improved methods are the scientific and methodological basis for the designing algorithms and software. The practical results include the following: –the method and software for designing a convolutional neural network were developed for the task of multispectral multiclass satellite images classification with an optimal set of spectral indexes, which increased the classification accuracy up to 84.19% and the F1 metric up to 84.05%; –the improved convolutional neural networks optimization method and software have been developed for the task of the Earth’s surface satellite images, which increased the classification accuracy and F1 metric to 97.04% and 97.05% respectively, and for the classes Herbaceous Vegetation, Permanent Crop, and Highway the F1 metric on the test dataset increased up to 20%. In addition, the use of the modern Ray Tune framework made it possible to effectively use the available resources under the defined budget restrictions; –the high-quality high-resolution satellite images filtering procedure has been developed, which accelerated and automated the creation of the EuroPlanet dataset in a computerized system; –the multiclass land cover EuroPlanet high-resolution images with the optimal configuration of spectral indexes classification method has been improved and software has been developed. The classification accuracy on the test data increased to 93.83%, and the F1 metric increased to 93.56%. The practical possibility of using the improved method is shown. The research results confirmed the practical and theoretical significance of the developed methods and procedures, provided practical recommendations for the application of the developed methods in the conditions of a full-scale Russian invasion of Ukraine, and considered the prospects for their further development.
Система підтримки прийняття діагностичних рішень при аналізі цифрових медичних зображень
(Національний технічний університет "Харківський політехнічний інститут", 2023) Шехна, Халед
Дисертація на здобуття наукового ступеня доктора філософії (PhD) за спеціальністю 123 – Комп’ютерна інженерія – Національний технічний університет “Харківський політехнічний інститут ”, Харків, 2023. Дисертація присвячена вирішенню актуальної науково-практичної задачі підвищення ефективності виявлення анатомічних та патологічних структур на слабо контрастних напівтонових зображеннях молочної залози шляхом розробки формалізованої моделі процесу мамографічного обстеження, математичних методів реалізації її окремих етапів та розробка системи підтримки прийняття рішень за допомогою сучасних інформаційних технологій. Метою дисертаційної роботи є удосконалення методів аналізу напівтонових біомедичних зображень в мамографічних системах підтримки прийняття рішень. Об'єктом дослідження є процес аналізу анатомічних та патологічних структур на цифрових мамограмах. Предметом дослідження виступають методи виділення та класифікації анатомічних та патологічних структур на цифрових мамограмах. У вступі акцентовано увагу та обґрунтовано актуальність теми, що досліджується, показано зв’язок роботи з науковими програмами, планами та темами, наведено наукову новизну та практичне значення отриманих результатів.В першому розділі проаналізовано види досліджень молочних залоз та показана важливість мамографічних обстежень, які є найбільш безпечними і недорогими, та мають достатню інформативність, особливо на ранніх етапах діагностики патології молочної залози. Виконано аналіз методів цифрової обробки біомедичних зображень та розглянуті особливості побудови систем підтримки прийняття рішень в медицині біомедичних зображень. Показано, що існуючі методи цифрової обробки зображень мають обмежену сферу застосування при обробці мамограм, оскільки зазначені зображення малоконтрастні, містять значну шумову складову, а параметри діагностичних елементів – значну варіабельність. Крім того, такі елементи мамограм, як зовнішньопротокові утворення та мікрокальцинати мають регулярну (фрактальну) структуру. Обгрунтована актуальність обраної теми роботи та встановлена доцільність розробки спеціалізованих методів пошуку анатомічних і патологічних структур на цифрових мамограмах, а також класифікацію мамограм відповідно до типів виявлених патологій. Отримані висновки дали змогу сформулювати мету роботи та задачі дослідження. В другому розділі виконана формалізація етапів процесу проведення мамографічних досліджень лікарем-мамологом та виділені критичні елементи мамографічної СППР, які можуть призвести до вироблення некоректних рішень або відмови від прийняття рішення. Виконана формалізації етапів процесу проведення мамографічних досліджень та розроблена узагальнена модель процесу, яка включає функціональну, структурну, інформаційну та математичну модель, які в остаточному підсумку дозволяють підвищити достовірність та обґрунтованість лікарських рішень та мінімізувати ризики лікарських помилок. В третьому розділі розглянуто особливості процесу морфологічного аналізу цифрових мамограм. Відмічено, що мамограма відноситься до класу біомедичних зображень з локально зосередженими ознаками. Завданням морфологічного аналізу є виділення на фоні завад інформативних структурних елементів мамограм, параметри яких слугують для формування простору діагностичних ознак. Показано перспективність використання фрактального аналізу для дослідження та класифікації мамограм, зокрема, для діагностики раку молочної залози на ранніх стадіях розвитку. Розроблено метод морфологічного аналізу цифрових маммограм з урахуванням їхньої фрактальної розмірності. Наведено відповідні математичні вирази та пропонується алгоритм обчислення фрактальної розмірності напівтонових зображень мамограм, або їх виділених фрагментів – зон інтересу. В четвертому розділі виконано розробку комбінованого діагностичного вирішального правила. Відмічено два підходи при постановці діагнозу: – традиційна діагностика, де кожне захворювання характеризується деяким набором значень діагностичних ознак (симптомів), які формують симптомокомплекс захворювання, та є експертною оцінкою кожного захворювання (суб’єктивна складова); – задача класифікації, в якій моделлю об’єкта діагностики є "чорна шухляда", і шукається залежність між формалізованими станами об’єкта діагностики (множиною діагностичних станів в заданій предметній області) і вектором вхідних діагностичних ознак (об’єктивна складова). Вказана залежність визначається на етапі навчання при аналізі навчальної вибірки, елементами якої виступають пацієнти з підтвердженим діагнозом, а в подальшому на етапі класифікації вона використовується для постановки діагнозу нових пацієнтів при аналізі вектору вхідних ознак. Обґрунтовано застосування в якості об’єктивної складової метод порівняння з еталоном, та розглянуто механізми врахування експертних оцінок щодо структури симптомокомплексу при обчисленні координат еталонів класів. В п’ятому розділі розроблена структура СППР проведення мамографічних обстежень на основі розроблених раніше функціональної, інформаційної, структурної та математичної моделей. Сформовано вимоги, яким повинна задовольняти система та розглянуто функціональне призначення основних модулів системи. Тестова перевірка виконувались за допомогою інтерактивного середовища MatLab із вбудованою високорівневою мовою програмування. Виконано тестування розроблених в дисертації методів на реальних даних, яке підтвердило їх працездатність та ефективність. У висновках наведено основні результати наукової роботи щодо вирішення поставлених наукових задач дослідження. За результатами дослідження отримано такі наукові результати: – удосконалено загальну модель процесу маммографічного обстеження, яка включає функціональну, структурну, інформаційну та математичні моделі шляхом формалізації етапів: введення діагностичних даних та попередня обробка мамограм з урахуванням особливостей їхнього відображення на слабоконтрастних напівтонових зображеннях молочної залози; фрактальна обробка цифрових мамограм з метою формування системи діагностичних ознак; розробка діагностичного вирішального правила формування комп’ютерного діагнозу; вироблення рішення щодо проведення діагностико-лікувального процесу, що дозволило застосувати формальні методи реалізації відмічених етапів; – набув подальший розвиток метод виділення та класифікації анатомічних та патологічних структур на цифрових маммограмах, включаючи внутрішньопротокові утворення та мікрокальцинати шляхом розрахунку їх фрактальної розмірності, що дозволило сформувати вектор діагностичних ознак для постановки комп’ютерного діагнозу; – вперше розроблено комбіноване діагностичне вирішальне правило на основі модифікації методу порівняння з еталоном шляхом внесення експертної інформації щодо структури симптомокомплексів при обчисленні координат прототипів класів, яке дозволяє врахувати як об’єктивну ймовірністну складову, так і суб’єктивну складову процесу постановки діагнозу, яка є формалізацією експертної оцінки структури симптомокомплексу вказаного захворювання. Запропоновано варіанти спільного використання його складових (колектив вирішальних правил, зважування та підсумовування оцінок). Практичне значення отриманих результатів для галузі інформаційних технологій полягає в тому, що розроблені в дисертаційній роботі методи фрактальної обробки цифрових мамограм слугують науково-методичною основою для розробки відповідного інформаційного, алгоритмічного та програмного забезпечення. Розроблена комп’ютерна система, яка забезпечує підтримку прийняття рішення при класифікації цифрових мамограм на предмет наявності/відсутності патологічних структур з метою подальшої діагностики. Результати дисертаційної роботи впроваджені у навчальний процес НТУ “ХПІ” на кафедрі “Комп’ютерна інженерія та програмування” при вивченні дисциплін «Обробка сигналів та зображень», «Проектування комп'ютерних діагностичних систем», «Основи наукових досліджень» та в дипломному і курсовому проектуванні.
Моделі, методи та інформаційна технологія інтелектуальної обробки текстового опису товарів масового вжитку
(Національний технічний університет "Харківський політехнічний інститут", 2023) Іващенко, Оксана Віталіївна
Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 122 - Комп’ютерні науки (12 - Інформаційні технології). - Національний технічний університет “Харківський політехнічний інститут” Міністерства освіти і науки України, м. Харків, 2023. У дисертаційній роботі вирішена науково-практична задача ідентифікації комплексного сприйняття семантики товарних пропозицій на онлайн-платформах електронної комерції шляхом інтелектуальної обробки текстового опису товарів, що дозволяє систематизувати пропозиції товарів та спростити пошук. Об’єктом дослідження є процес обробки текстової інформації в системах електронної комерції. Предметом дослідження є моделі, методи та інформаційна технологія інтелектуальної обробки текстового опису товарів масового вжитку. Метою дисертаційного дослідження є підвищення точності визначення схожості товарів масового вжитку на основі їх текстових описів, представлених в системі електронної комерції. При вирішенні завдань дисертаційного дослідження використані: методсистемного аналізу для розробки концепції інтелектуальної обробки текстового опису товарів масового вжитку; методи математичної статистики, методи теорії прийняття рішень; інструменти NLP для створення моделі текстового опису товарів, моделі оцінки схожості товарів, алгоритму створення тегового ядра та моделі еталонного товару; методи теорії інтелекту для розробки моделі визначення схожості товарних пропозицій, методи експертного оцінювання для збору даних на основі краудсорсінгу; стандарт IDEF та уніфікована мова моделювання UML для проєктування інформаційної технології та компонентів програмного забезпечення, компонентно-орієнтовані методи для розробки інформаційної технології інтелектуальної обробки текстових описів. У вступі обґрунтовано актуальність теми дослідження, сформульовані мета, задачі та методи дослідження, відображено зв’язок дослідження з науковими програмами кафедри, наведено наукову новизну та практичне значення отриманих результатів, зазначено особистий внесок здобувача. В першому розділі здійснено дослідження стану розвитку електронної комерції, проблем та переваг, які супроводжують даний розвиток, проаналізовано особливості реалізації рекомендаційних систем, та запропоновані можливі покращення щодо реалізації та функціонування рекомендаційних систем. Виявлено, що багато дослідників акцентувало увагу на необхідності обробки текстової інформації представлення товару для систематизації та нормалізації інформації про товари та використання отриманої структурованої інформації для визначення схожості товарів, і, як наслідок для підвищення точності рекомендацій. Проведено аналіз сучасного стану завдань текстової обробки інформації, зокрема вирішення задач розпізнавання сутностей (entity resolution - ER) та визначення схожості товарів (item matching - IM), особливостей реалізації підходів щодо вирішення цих задач, проведено дослідження сучасних методів, підходів та алгоритмів, які використовуються для обробки текстової інформації, проаналізовано характеристики текстового представлення товарів, які використовують в сучасних підходах обробки текстової інформації в системах електронної комерції. У другому розділі обґрунтовано концепцію інтелектуальної обробки текстової інформації в системах електронної комерції, визначені основні етапи. Обґрунтовано необхідність використання алгоритмів векторизації та методів машинного навчання для обробки неструктурованих текстових даних. Розроблено модель представлення текстового опису товарів, яка є основою для подальшого аналізу та визначення схожості товарів. Запропоновано застосування етапу блокування (blocking) для зменшення складності обробки великого обсягу текстових описів, що дозволяє за рахунок поділу всього набору текстових даних на групи схожих товарів зменшити розрахункову складність алгоритмів співставлення текстових описів. Запропоновано модель гнучкого пайплайну оброки текстових даних, яка дозволяє оптимізувати параметри блокування за рахунок вибору конфігурації на основі наявної бібліотеки алгоритмів векторизації та кластеризації. У третьому розділі представлено методи співставлення та групування товарів в системі електронної комерції, розроблена модель визначення схожості товарів, яка базується на запропонованій у другому розділі моделі представлення текстового опису товарів. Запропоновано застосування підходу краудсорсінгу для збору додаткової інформації щодо визначення схожості товарів на основі порівняння зображень товарів та визначення колективної оцінки. Розроблено алгоритм побудови тегового ядра (множини ключових слів) для групи схожих товарів, який дозволяє визначити релевантні до кожного товару теги, які у сукупності характеризують всю групу схожих товарів та є найбільш вживаними в текстових описах товарів на онлайн платформах. Розроблена модель еталонного товару з урахуванням семантики текстового представлення та узагальнених значень артибутів. Розглянуто пошук товарів з використанням моделі еталонного товару на основі підходу навчання з підкріпленням. У четвертому розділі представлено розроблену інформаційну технологію інтелектуальної обробки текстових описів товарів та результати проєктування компонентів програмного забезпеченнчя. Інформаційна технологія базується на підході щодо створення гнучкого пайплану обробки текстових даних та включає в себе ряд процесів обробки та перетворення неструктурованої текстової інформації в змістовний структурований набір ключових слів (тегове ядро), які характеризують групу схожих товарів. Представлено прототип архітектурного рішення, яке використовує принципи компонентно-орієнтованої розробки. Також наведено основні результати експериментальних досліджень та апробації розроблених моделей, підходів, алгоритмів щодо інтелектуальної обробки текстової інформації, а також практичне впровадження підходу Результати експериментів підтверджують працездатність запропонованих моделей. У висновках коротко охарактеризовано вирішені завдання дисертаційної роботи, представлено теоретичну та практичну значущість отриманих результатів, наведено дані про впровадження та апробацію основних результатів дослідження. Наукова новизна проведеного дослідження полягає в наступному: 1 Удосконалено модель текстового опису товарів масового вжитку, що на відміну від існуючих базується на ідентифікації комплексного сприйняття людиною товарних пропозицій, що дозволяє підвищити точність визначення відповідності реальному товару за рахунок врахування семантики трьох складових опису (назва, характеристика, специфікація). 2 Удосконалено модель схожості товарів, яка дозволяє порівнювати споживчі характеристики товарів електронної комерції на основі їх текстового опису та, на відміну від існуючих, враховує вподобання споживачів та сприйняття текстового опису, що дозволяє систематизувати пропозиції та спростити пошук. 3 Дістала подальшого розвитку інформаційна технологія інтелектуальної обробки текстових описів товарів за рахунок вдосконалення моделі текстового опису товару, групування схожих товарів та представлення групи схожих товарів ядром тегів та еталонним товаром, що на відміну від існуючих підходів, дозволяє підвищити ефективність пошуку та ідентифікації товарів. Результати дисертаційної роботи впроваджено у навчальному процесі кафедри програмної інженерії та інтелектуальних технологій управління Національного технічного університету «Харківський політехнічний інститут» (акт від 14.11.2022 р.), використано у науково-дослідних роботах "Розробка інформаційно-аналітичного забезпечення управління ефективністю та якістю в складних системах за умови євроінтеграції України» (ДР № 0117U004806), «Створення моделей та методів збору та автоматизованої переробки бізнес-інформації у веб-просторі» (ДР № 0119U002556), «Розробка методів моніторингу актуальних даних в системах організаційного управління» (ДР № 0121U108870), у яких здобувачка брала участь як виконавиця окремих етапів (акт від 01.11.2022 р.) та впроваджено для вирішення практичних завдань в діяльності ТОВ Фінпрогруп» (довідка від 06.01.2023 р.).
Просування продукції промислових підприємств за допомогою інструментарію цифрового маркетингу
(Національний технічний університет "Харківський політехнічний інститут", 2021) Дериколенко, Анна Олександрівна
Дериколенко А.О. – Просування продукції промислових підприємств за допомогою інструментарію цифрового маркетингу. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня кандидата економічних наук за спеціальністю 08.00.04 "Економіка та управління підприємствами (за видами економічної діяльності)" (галузь знань – "Економічні науки"). – Національний технічний університет "Харківський політехнічний інститут", Харків, 2021. Дисертація присвячена вирішенню важливого науково-прикладного завдання розроблення теоретико-методичних положень щодо просування продукції промислових підприємств за допомогою інструментів цифрового маркетингу. В дисертаційній роботі удосконалено методичні положення щодо використання інструментів просування продукції промислових підприємств, які на відміну від існуючих, ґрунтується на застосуванні інтернет-платформ для більш результативного пошуку нових партнерів, впровадження технологічних рішень у виробничо-збутову діяльність та скорочення витрат часу, що дозволяє підвищити ефективність діяльності, покращити ринкові позиції серед конкурентів та забезпечує вихід на нові ринки. Удосконалена класифікація інструментарію цифрового маркетингу, що відрізняється від існуючих диференціацією ознак за технологічними, організаційними та загальними характеристиками, а також виокремленням нових ознак: "за технологією виготовлення та поширення", "за видом посередництва", "за ступенем спеціалізації", "за типом відносин", що дозволяє визначити форми співпраці, конкретизувати характеристики цифрових інструментів, визначати напрямки найбільш ефективного їх застосування, формалізувати процес інструментального забезпечення та управління процесами просування продукції промислових підприємств. Удосконалений теоретичний базис концептуальних основ просування продукції промислових підприємств, що на відміну від наявних, ґрунтується на уточненні та доповненні передумов забезпечення, принципів, переваг діяльності, вимог ринку, а також на розширенні й систематизації методичного апарату та інструментарію. Це дозволяє формалізувати змістовну складову діяльності підприємств з використанням технологій та інструментарію цифрового маркетингу. Набули подальшого розвитку методичні рекомендації щодо оцінювання економічної ефективності використання Digital-засобів, що, на відміну від інших дають змогу врахувати негрошові показники важливості заходів в довгостроковій перспективі, які складно формалізувати в монетарних термінах. Це дозволяє розширити інструментальне забезпечення програм просування продукції. Поглиблено методичний підхід до створення програми просування продукції ПП, в якому, на відміну від існуючих, оптимізація комунікаційних витрат здійснюється на основі плаваючого бюджету з урахуванням коригувальних коефіцієнтів, що дозволяє забезпечити максимальну кількість контактів з цільовою аудиторією та вибір маркетингових інструментів відповідно до комплексних оцінок перспективності їх застосування (з позицій отримання комерційного результату у майбутньому). Набув подальшого розвитку методичний підхід до формування медіа-плану просування продукції промислових підприємств, який, на відміну від існуючих, ґрунтується на психологічних патернах сприйняття і запам’ятовування інформації споживачами із застосуванням інструментарію передачі специфічних особливостей інформації, що створює можливості коригування маркетингової та виробничої діяльності на основі онлайн-аналізу засобами Web-аналітики (Google Analytics, Unit-economics аналітики, Yahoo Web Analytics, meta.ua тощо). Це дозволяє за рахунок відстеження і регулювання показників (у першу чергу, частоти впливу на споживачів) оптимізувати ефективність комунікаційної кампанії. Основні положення і висновки дисертаційної роботи доведені до рівня теоретико-методичних розробок і практичних рекомендації, що підтверджується актами про їх впровадження у діяльність промислових підприємств машинобудівної та хімічної галузей: ТОВ "Турбомаш", ПП "Завод ПЕМ", ТОВ "Сумський машинобудівний завод", ТОВ "Азовський механічний завод", ТОВ КБ "Укрспецмаш", а також у навчальний процес СумДУ. Пропозиції автора дозволять у комплексі вирішити завдання просування продукції вітчизняних промислових підприємств в сучасних умовах господарювання.
Просування продукції промислових підприємств за допомогою інструментарію цифрового маркетингу
(Національний технічний університет "Харківський політехнічний інститут", 2021) Дериколенко, Анна Олександрівна
Дисертація на здобуття наукового ступеня кандидата економічних наук за спеціальністю 08.00.04 – Економіка та управління підприємствами (за видами економічної діяльності). – Національний технічний університет "Харківський політехнічний інститут", Харків, 2021. У дисертації розроблено та науково обґрунтовано теоретико-методичні організаційно-економічні положення щодо просування продукції промислових підприємств за допомогою інструментарію цифрового маркетингу. Удосконалено методичні положення щодо використання інструментів просування продукції промислових підприємств що ґрунтуються на застосуванні інтернет-платформ. Удосконалено класифікацію інструментарію цифрового маркетингу, що відрізняється диференціацією ознак за технологічними, організаційними та загальними характеристиками, а також виокремленням ознак: "за технологією виготовлення та поширення", "за видом посередництва", "за ступенем спеціалізації", "за типом відносин". Удосконалено теоретичний базис концептуальних основ просування продукції промислових підприємств за допомогою інструментарію цифрового маркетингу в умовах глобалізації. Набули подальшого розвитку методичні рекомендації щодо оцінювання економічної ефективності використання Digital-засобів. Поглиблено методичний підхід до розроблення програми просування продукції промислових підприємств за допомогою інструментарію цифрового маркетингу та методичний підхід до розроблення медіа-плану; розширено визначення Інтернет-платформи та удосконалено методичні положення до використання інструментів просування продукції промислових підприємств (у т. ч. інтернет-платформ).
Інформаційна технологія класифікації впорядкованих масивів даних із фрактальними властивостями методами машинного навчання
(Національний технічний університет "Харківський політехнічний інститут", 2021) Булах, Віталій Анатолійович
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – "Інформаційні технології". – Міністерство освіти і науки України національний технічний университет "Харківський політехнічний інститут", 2021. Дисертаційна робота присвячена вирішенню задачі класифікації фрактальних упорядкованих масивів даних (УМД) в різноманітних сферах людської діяльності, наприклад в медицині при діагностиці захворювань по енцефалограмам, кардіограмам; при виявленні кризових ситуацій по біржовим індексам; виявлення вторгнень в комп’ютерну мережу та інше. Метою дисертаційної роботи є підвищення точності класифікації упорядкованих масивів даних із фрактальними властивостями шляхом створення інформаційної технології класифікації методами машинного навчання. Об’єкт дослідження – процес класифікації об’єктів методами машинного навчання. Предмет дослідження – методи та моделі класифікації фрактальних упорядкованих масивів даних. Методи дослідження. При вирішенні поставлених задач у роботі використовувався математичний апарат методів машинного навчання; методи математичної статистики – для статистичного аналізу упорядкованих масивів даних, аналізу точності класифікації методами машинного навчання; методи теорії хаоса та фрактального аналізу – для обчислення фрактальних та рекурентних характеристик. Наукова новизна отриманих результатів полягає у тому, що вперше встановлено наступне: – розроблено інформаційну технологію класифікації фрактальних упорядкованих масивів даних, яка заснована на поєднанні методів дерев рішень та нейронних мереж, враховує самоподібні та мультифрактальні властивості упорядкованих даних, що дозволяє збільшити точність класифікації; – запропоновано метод оцінювання показника Херста за значеннями часового ряду, який засновано на застосуванні класифікаційних методів машинного навчання, що дозволяє суттєво зменшити довірчий інтервал оцінки; – застосовані рекурентні характеристики часових рядів, як ознаки для класифікації часових рядів на основі їхніх фрактальних властивостей методами машинного навчання, дозволили збільшити точність класифікації. Подальший розвиток отримали: – метод генерації фрактальних реалізацій на основі стохастичного мультиплікативного біноміального каскаду, який на відміну від існуючих використовує аналітичне визначення параметрів несиметричного бета-розподілу, що дозволяє генерувати упорядковані масиви даних із заданими мультифрактальними властивостями; – методи бінарної класифікації часових рядів з фрактальними властивостями, що засновані на використанні дерев прийняття рішень та нейронних мереж, які на відміну від існуючих використовують як ознаки фрактальні та рекурентні характеристики, що дозволяє збільшити точність класифікації. Практичне значення отриманих результатів полягає у тому, що в результаті виконаного дисертаційного дослідження створено комплекс методів, алгоритмів і програм, які дозволяють вирішити завдання класифікації фрактальних упорядкованих масивів даних. Усі теоретичні розробки дисертації доведені автором до конкретних методів і покладені в основу функціонування інформаційної технології класифікації впорядкованих масивів даних із фрактальними властивостями методами машинного навчання. Запропонований метод оцінювання показника Херста, який програмно реалізований, дозволяє покращити точність його оцінювання за упорядкованими даними, а саме: зменшує довірчий інтервал оцінки в декілька разів. Проведений у роботі аналіз існуючих методів класифікації упорядкованих масивів даних показав: незважаючи на те, що застосування машинного навчання в задачах аналізу фрактальних даних постійно зростає, на сьогоднішній, день не розроблено інформаційної технології, яка призначена для задач класифікації фрактальних масивів даних, зокрема часових рядів. У роботі виконано огляд існуючих методів генерування фрактальних та мультифрактальних упорядкованих масивів даних. Доведена необхідність удосконалення таких методів, та запропоновано підхід до генерації стохастичного мультиплікативного біноміального каскаду на основі вирішення задачі нелінійної оптимізації. Розв’язання цієї задачі дозволяє використовувати несиметричний бета-розподіл для генерації стохастичного мультиплікативного біноміального каскаду, що дозволило охопити широкий спектр мультифрактальних властивостей. Використання удосконаленого методу генерації стохастичного мультиплікативного біноміального каскаду дає змогу генерувати більш складні у фрактальному сенсі реалізації мультифрактального броунівського руху. Проведено чисельні експерименти класифікації різних типів упорядкованих масивів даних, які були розбиті на класи за їхніми фрактальними властивостями. Були застосовані наступні методи класифікації: дерева прийняття рішень, bagging, випадковий ліс, багатошаровий персептрон, мережі довгої короткострокової пам’яті. Дослідження показали, що діапазон мультифрактальних і самоподібних властивостей відіграє важливу роль для вибору класифікатора, і відповідно на точність класифікації. Було доведено що використання статистичних та фрактальних характеристик мультифрактальних упорядкованих масивів даних дозволяє покращиті точність класифікації УМД порівняно з використанням значень УМД як ознак при класифікації. Розглянуто рекурентні діаграми та запропоновано використання їх характеристик в якості ознак при навчанні моделей класифікації. Дослідження показали що характеристики рекурентних діаграм дають суттєвий внесок в точність класифікації, та дозволяють класифікувати УМД з монофрактальними властивостями. Розроблена інформаційна технологія класифікації УМД, котра дозволяє підібрати оптимальний метод машинного навчання для класифікації досліджуваного упорядкованого масиву даних. Запропоновано використання розробленої інформаційної технології для визначення показника Херста УМД. Експериментально доведено ефективність використання методів машинного навчання для визначення показника Херста та його довірчого інтервалу, та дозволило скоротити довірчий інтервал показника Херста для фрактальних та мультифрактальних УМД більше ніж у 2 рази. Приведено результати застосування запропонованої інформаційної технології для виявлення DDoS-атак в комп’ютерній мережі. ІТ збільшує кількість виявлених атак, що дозволяє використовувати запропоновану ІТ як додатковий фільтр при виявленні DDoS-атак. Запропоновані у роботі моделі, методи та інформаційна технологія класифікації фрактальних даних були впроваджені у діяльність підприємств різних галузей економіки: – для підприємства ПрАт «Фарлеп-Інвест» (м. Харків) впроваджено розроблену інформаційну технологію для зменшення негативного впливу кібер-атак на інформаційні системи підприємства; – для підприємства КБ «ПриватБанк» (м. Харків) впроваджено розроблену інформаційну технологію для виявлення вторгнень в інформаційні системи підприємства. Результати дисертаційного дослідження впроваджені у навчальному процесі Харківському національному університеті радіоелектроніки на кафедрі інфокомунікаційної інженерії при викладанні навчальної дисципліни "Artificial Intelligence (Штучний інтелект)".
Інформаційна технологія класифікації впорядкованих масивів даних із фрактальними властивостями методами машинного навчання
(Національний технічний університет "Харківський політехнічний інститут", 2021) Булах, Віталій Анатолійович
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – інформаційні технології. – Національний технічний університет "Харківський політехнічний інститут", Харків, 2021 р. Дисертацію присвячено розробці інформаційної технології класифікації упорядкованих масивів даних (УМД), які мають фрактальні властивості, з використанням методів машинного навчання. В роботі програмно реалізовано методи генерації УМД з мультифрактальними властивостями різних типів. Здійснено чисельні експерименти, при виконанні яких проводилася класифікація різних типів упорядкованих даних, множина УМД розбивалась на класи за їхніми фрактальними властивостями. Як класифікатори застосовано ансамблеві методи дерев рішень та нейронні мережі, у якості ознак при класифікації використовувалися статистичні, фрактальні та рекурентні характеристики УМД. Дослідження показали, що діапазон мультифрактальних і самоподібних властивостей масивів даних відіграє важливе значення для вибору класифікатора і набору ознак, та, відповідно, точності класифікації. Якщо впорядковані дані характеризуються сильно вираженими мультифрактальними характеристиками, в більшості випадків достатньо використовувати значення УМД як ознаки при класифікації з використанням ансамблевих методів дерев рішень; також вони ефективно класифікуються за фрактальними характеристиками. Якщо УМД має монофрактальні властивості, то такі дані доцільно класифікувати з використанням рекурентних та фрактальних характеристик за допомогою нейронних мереж. Найбільш складним випадком є класифікація УМД, які мають слабо виражену мультифрактальність та слабку автокореляційну залежність. У цьому випадку пропонується застосувати ансамбль з використанням як окремих класифікаторів нейронних мереж та випадкового лісу, де в якості ознак використовуються фрактальні та рекурентні характеристики УМД. Розроблена технологія дозволяє використовувати її для обчислення показника Херста за часовими рядами та дозволяє зменшити довірчий інтервал оцінки показника Херста в декілька разів. Запропонована інформаційна технологія аналізує вхідний потік інформації та обирає набір характеристик класифікатора для максимізації точності класифікації УМД. Таким чином, інформаційна технологія дозволяє класифікувати дані з різними фрактальними властивостями, що дозволяє використовувати її для класифікації упорядкованих масивів даних різноманітної природи, наприклад, для виявлення DDoS-атак в інфокомунікаційних даних, уточнення діагнозу за записами електроенцефалограми та електрокардіографії, класифікації сейсмічних подій за сейсмограмами тощо.