Інформаційна технологія екстракції бізнес знань з текстового контенту інтегрованої корпоративної системи
Вантажиться...
Дата
Автори
ORCID
DOI
Науковий ступінь
кандидат технічних наук
Рівень дисертації
кандидатська дисертація
Шифр та назва спеціальності
05.13.06 – інформаційні технології
Рада захисту
Спеціалізована вчена рада Д 64.050.07
Установа захисту
Національний технічний університет "Харківський політехнічний інститут"
Науковий керівник/консультант
Шаронова Наталія Валеріївна
Члени комітету
Куценко Олександр Сергійович
Гамаюн Ігор Петрович
Северин Валерій Петрович
Гамаюн Ігор Петрович
Северин Валерій Петрович
Назва журналу
Номер ISSN
Назва тому
Видавець
НТУ "ХПІ"
Анотація
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – інформаційні технології. – Національний технічний університет "Харківський політехнічний інститут", Харків, 2016.
Мета дисертаційного дослідження – створення інформаційної технології екстракції бізнес знань інтегрованої корпоративної системи (ІКС) на основі інформаційно-логічних моделей і методів смислового опрацювання текстового контенту. Основні результати: вперше розроблено логіко-лінгвістичну модель генерації фактів з текстових потоків ІКС, яка базується на використанні поверхневих граматичних характеристик сутностей, предикатів та атрибутів, що до-зволяє ефективно екстрагувати з текстового контенту профільні знання про суб'єкти моніторингу. Отримав подальший розвиток метод компараторної ідентифікації, який використано для структурування відношень фактів бізнес знань ІКС. Реалізація методу дозволила класифікувати атрибути сутностей за класами відношень за рахунок смислової тотожності триплетів фактів, які об'єктивно визначені компаратором. Удосконалено метод виявлення актуальної множини класифікованих сутностей предметної області, який відрізняється комплексним використанням лінгвістичних, статистичних й смислових характеристик в наївному байєсівському класифікаторі. Метод дозволяє класифікувати сутності, що екстрагуються, за апріорно виділеними типами. Удосконалено інформаційну технологію формування єдиного інформаційного простору бізнес діяльності корпорації, яка дозволяє за рахунок використання алгебро-логічних перетворень здійснювати породження складного знання шляхом експліцитного узагальнення інформації, що прихована у сукупності часткових фактів.
Опис
Бібліографічний опис
Гаутам А. П. С. Інформаційна технологія екстракції бізнес знань з текстового контенту інтегрованої корпоративної системи [Електронний ресурс] : автореф. дис. ... канд. техн. наук : спец. 05.13.06 / Аджіт Пратап Сінгх Гаутам ; [наук. керівник Шаронова Н. В.] ; Нац. техн. ун-т "Харків. політехн. ін-т". – Харків, 2016. – 20 с. – Бібліогр.: с. 15-17. – укр.
