122 "Комп'ютерні науки"
Постійне посилання колекціїhttps://repository.kpi.kharkov.ua/handle/KhPI-Press/47370
Переглянути
Документ Багатоагентні моделі та методи збору та видобування бізнес-інформації у веб-просторі(Національний технічний інститут "Харківський політехнічний інститут", 2021) Матвєєв, Олександр МиколайовичДисертація на здобуття наукового ступеня доктора філософії за спеціальністю 122 – Комп’ютерні науки (12 – Інформаційні технології). – Національний технічний університет «Харківський політехнічний інститут» Міністерства освіти і науки України, Харків, 2021. Об’єктом дослідження є процеси пошуку, збору та видобування даних у розподіленому інформаційному просторі. Предметом дослідження є моделі, методи та інформаційна технологія збору та видобування інформації у веб просторі на основі багатоагентної обробки даних. У дисертаційній роботі вирішена науково-практична задача збору та видобування бізнес-інформації у розподіленому інформаційному середовищі для забезпечення актуальності та ефективності рішень, що приймаються. Для вирішення поставлених задач використано наступні методи: системний аналіз для розробки концептуальної моделі веб-моніторингу; методи теорії штучного інтелекту та алгебри скінченних предикатів першого порядку для створення формальної архітектури агентів; метод компараторної ідентифікації, методи інтелектуального аналізу даних, методи побудови онтологій та методи математичної статистики для обробки даних, які зібрано із веб-сторінок; методи теорії прийняття рішень; уніфікована мова моделювання UML та методологія агентно-орієнтованого програмування для реалізації прототипу агентної платформи, заснованої на використанні формальних методів для проектування багатопотокових систем. У вступі дисертаційної роботи обґрунтовано актуальність теми дослідження, зазначено зв’язок роботи з науковими темами, сформульовано мету і задачі дослідження, визначено об’єкт, предмет та методи дослідження, показано наукову новизну та практичне значення отриманих результатів, наведено інформацію про практичне використання, особистий внесок здобувача, апробацію результатів дослідження та їх висвітлення у публікаціях. У першому розділі дисертаційної роботи проведено аналіз систем пошуку та моніторингу інформації, підходів для їх вирішення та аналіз недоліків існуючого апарата тематичного пошуку. Виділено проблеми, які в даний момент ще не вирішені і є актуальними з точки зору аналізу та підвищення ефективності прийняття бізнес рішень. Визначено напрямок підвищення ефективності процесів підтримки прийняття рішень за рахунок збору актуальних даних у веб-просторі. Розглянуто існуючі методи та засоби комплексного підходу до реалізації процесу пошуку даних веб-простору на основі інтелектуальних технологій. Проаналізовані найбільш популярні та широко використовувані парадигми програмування. В даній роботі пропонується використовувати агентну архітектуру при проектуванні системи моніторингу. Це пов’язано з її перевагами по відношенню до інших підходів. Обрано напрями досліджень, поставлено основні задачі дисертаційної роботи. У другому розділі дисертаційної роботи сформовано теоретичні основи підвищення ефективності прийняття бізнес рішень шляхом розробки багатоагентних моделей та методів збору та видобування бізнес-інформації у веб-просторі. Обгрунтовано використання математичного апарату алгебри скінченних предикатів, розроблено моделі пошуку, екстракції та видобування инфомації на основі використання компаратоної моделі. Розгляуто концепцію збору та видобування бізнес-інформації на основі використання багатоагентних систем. Агентна платформа є базовим інструментом створення інтелектуальних багатоагентних систем, що дозволяє створювати, знищувати, інтерпретувати, запускати і переміщати агентів. Основними функціями агентних платформ є: організація взаємодії агентів; передача повідомлень всередині платформи та між різними платформами; підтримка онтологій; управління агентами, їх життєвими циклами; пошук агентів і даних про них всередині системи; забезпечення безпеки агентів. Методологічну основу створення агентної платформи визначають стандарти MASIF (Mobile Agent System Interoperability Facility) та FIPA (Foundation of Physical Intelligent Agents). В роботі запропоновано використання стандартів FIPA, які надають базові визначення понять комунікації агентів. В основі багатоагентного підходу лежить поняття програмного агента, який реалізований і функціонує як самостійна спеціалізована комп’ютерна програма або елемент штучного інтелекту. Використання програмних агентів дозволяє підтримувати та вдосконалювати процес прийняття бізнес рішень. На основі проведених досліджень, відображених у даному розділі, були отримані наступні нові наукові результати: сформовано комплексний підхід до реалізації процесу збору даних веб-простору на основі інтелектуальних технологій; удосконалено модель екстракції бізнес-інформації. У третьому розділі удосконалено методи пошуку та збору бізнес-інформації за рахунок використання методу компараторної ідентифікації для побудови моделі оцінки релевантності веб-сторінки та багатоагентної моделі направленого пошуку, що надає можливість пошуку інформаційних ресурсів за принципом корисності для прийняття рішень. В цілому розроблені методи видобування бізнес інформації засновується на використанні багатоагентного підходу та формальної архітектури агента на основі компараторної ментальної моделі для пошуку та збору даних у веб-просторі, що надає комплексний підхід до вирішення задач збору бізнес-інформації, дозволяючи обґрунтовано приймати бізнес рішення. Цей підхід дозволяє забезпечити повноту та актуальність комерційної інформації, яка отримана з веб-простору, що підвищує ефективність прийняття бізнес рішень. Дослідження даного розділу дозволили одержати наступні результати: отримала подальший розвиток модель інтерпретації неповної суперечливої інформації, яку отримано шляхом збору та видобування у веб-просторі. У четвертому розділі дисертаційної роботи представлено основні результати щодо розробки інформаційної технології збору та видобування бізнес-інформації на основі запропонованого методу та розроблених моделей екстракції, інтерпретації та оцінки даних, що містяться у веб-просторі, шляхом реалізації багатоагентної моделі обробки даних. На основі аналізу існуючих підходів до проектування агентно-орієнтованих програмних систем та специфікацій стандартів багатоагентних систем були виділені підходи для побудови архітектури агентної платформи та відповідні вимоги. Наведені вимоги обумовлюють вибір технологій реалізації інформаційної системи. В даній роботі розроблено прототип агентної платформи для реалізації багатопотокових систем у різних предметних областях. В роботі наведено результати експериментів, які засвідчують працездатність запропонованих моделей. Аналіз отриманих результатів дослідження показав, що сформований метод та розроблені моделі, на яких базується інформаційна технологія, на відміну від існуючих, надають можливість пошуку та збору інформації, яка є корисною для бізнесу з урахуванням семантики контенту веб-ресурсів, виключенням дублікатів та оцінки на повноту та достовірність даних. За дослідженнями даного розділу отримані наступні результати: створена специфікація вимог до програмного забезпечення; розроблено програмні компоненти серверної частини програмної системи, що дозволяє проводити екстракцію даних з віртуальних торгівельних площадок; проведено експерименти на придатність агентної платформи для вирішення задачі збору та видобування бізнес-інформації; проведено тестування розроблених програмних компонентів та доведено їх ефективність для реалізації багатоагентної обробки даних. Дисертаційна робота виконана у межах науково-дослідних робіт: «Створення моделей та методів збору та автоматизованої переробки бізнес-інформації у веб-просторі», № ДР 0119U002556; «Розробка методів моніторингу актуальних даних в системах організаційного управління» № ДР 0121U108870, в яких автор брав участь як виконавець окремих етапів. Наукова новизна отриманих результатів полягає у наступному: - Отримала подальший розвиток модель екстракції бізнес-інформації за рахунок введення предикатів еквівалентності змісту бізнес-інформації, яка дозволяє залучити слабкоструктуровану текстову інформацію для забезпечення повноти даних. - Отримала подальший розвиток модель інтерпретації неповних суперечливих неоднорідних даних та даних, що дублюються, яка на відміну від існуючих, комбінує статистичні методи та інтегральну оцінку якості отриманих даних, що дозволяє підвищити ефективність обробки даних та знизити залежність від суб’єктивізму експертних оцінок. - Удосконалено інформаційну технологію багатоагентного збору бізнес-інформації у розподіленому інформаційному просторі, яка дозволяє здійснювати видобування актуальних даних в режимі реального часу на основі використання апарату алгебри скінченних предикатів та комплексу еталонних моделей збору даних.