Інформаційна технологія екстракції бізнес знань з текстового контенту інтегрованої корпоративної системи

dc.contributor.authorГаутам, Аджіт Пратап Сінгхuk
dc.date.accessioned2016-10-03T13:14:32Z
dc.date.available2016-10-03T13:14:32Z
dc.date.issued2016
dc.description.abstractДисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – інформаційні технології. – Національний технічний університет "Харківський політехнічний інститут", Харків, 2016. Мета дисертаційного дослідження – створення інформаційної технології екстракції бізнес знань інтегрованої корпоративної системи (ІКС) на основі інформаційно-логічних моделей і методів смислового опрацювання текстового контенту. Основні результати: вперше розроблено логіко-лінгвістичну модель генерації фактів з текстових потоків ІКС, яка базується на використанні поверхневих граматичних характеристик сутностей, предикатів та атрибутів, що до-зволяє ефективно екстрагувати з текстового контенту профільні знання про суб'єкти моніторингу. Отримав подальший розвиток метод компараторної ідентифікації, який використано для структурування відношень фактів бізнес знань ІКС. Реалізація методу дозволила класифікувати атрибути сутностей за класами відношень за рахунок смислової тотожності триплетів фактів, які об'єктивно визначені компаратором. Удосконалено метод виявлення актуальної множини класифікованих сутностей предметної області, який відрізняється комплексним використанням лінгвістичних, статистичних й смислових характеристик в наївному байєсівському класифікаторі. Метод дозволяє класифікувати сутності, що екстрагуються, за апріорно виділеними типами. Удосконалено інформаційну технологію формування єдиного інформаційного простору бізнес діяльності корпорації, яка дозволяє за рахунок використання алгебро-логічних перетворень здійснювати породження складного знання шляхом експліцитного узагальнення інформації, що прихована у сукупності часткових фактів.uk
dc.description.abstractThesis for a candidate degree in technical science, speciality 05.13.06 – Infor-mation Technologies. – National Technical University "Kharkiv Polytechnic Institute". – Kharkiv, 2016. The aim of the thesis is to develop information technology of extraction of business knowledge of integrated corporate system (ICS) based on the information logic models and methods of text content sense processing. The main results are as follows: a logic linguistic model of fact generation from ICS text streams has been developed which is based on surface grammar characteristics of identification of entities of actions and attributes which allows to effectively extract industry specific knowledge about the subjects of monitoring from text content. The thesis further develops the method of comparator identification used for structuring of ICS business knowledge facts relationship. The method allows to classify the attributes of entities according to class relationships due to sense identity of fact triplets which are determined by the comparator objectively. The paper improves the method of determination of actual set of classified entities of a subject domain which is distinguished by an integral use of linguistic, statistical and sense characteristics in the naïve Bayes classifier. The method allows to classify entities extracted according to types determined a priori. The thesis improves the development of information technology of common information space of corporation business activity which allows complicated knowledge generation by means of explicit generalization of information hidden in the collection of partial facts using algebra logic transformations.en
dc.identifier.citationГаутам А. П. С. Інформаційна технологія екстракції бізнес знань з текстового контенту інтегрованої корпоративної системи [Електронний ресурс] : автореф. дис. ... канд. техн. наук : спец. 05.13.06 / Аджіт Пратап Сінгх Гаутам ; [наук. керівник Шаронова Н. В.] ; Нац. техн. ун-т "Харків. політехн. ін-т". – Харків, 2016. – 20 с. – Бібліогр.: с. 15-17. – укр.uk
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/23554
dc.language.isouk
dc.publisherНТУ "ХПІ"uk
dc.subjectінформаційна технологіяuk
dc.subjectінтегрована корпоративна системаuk
dc.subjectекстракція бізнес знаньuk
dc.subjectідентифікація сутностейuk
dc.subjectлогіко-лінгвістичні моделіuk
dc.subjectавтореферат дисертаціїuk
dc.subjectinformation technologyen
dc.subjectintegrated corporate systemen
dc.subjectbusiness knowledge extractionen
dc.subjectidentification of entitiesen
dc.subjectlogic linguistic modelsen
dc.subject.udc004.912:007.51
dc.titleІнформаційна технологія екстракції бізнес знань з текстового контенту інтегрованої корпоративної системиuk
dc.title.alternativeInformation technology of business knowledge extraction from text content of the integrated corporate systemen
dc.typeThesisen
thesis.degree.advisorШаронова Наталія Валеріївнаuk
thesis.degree.committeeMemberКуценко Олександр Сергійовичuk
thesis.degree.committeeMemberГамаюн Ігор Петровичuk
thesis.degree.committeeMemberСеверин Валерій Петровичuk
thesis.degree.departmentСпеціалізована вчена рада Д 64.050.07uk
thesis.degree.discipline05.13.06 – інформаційні технологіїuk
thesis.degree.grantorНаціональний технічний університет "Харківський політехнічний інститут"uk
thesis.degree.levelкандидатська дисертаціяuk
thesis.degree.nameкандидат технічних наукuk

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Ескіз
Назва:
avtoreferat_2016_Gautam_Informatsiina_tekhnolohiia.pdf
Розмір:
599.67 KB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
11.23 KB
Формат:
Item-specific license agreed upon to submission
Опис: