Информационная технология экстракции бизнес знаний из текстового контента интегрированной корпоративной системы

dc.contributor.authorГаутам, Аджит Пратап Сингхru
dc.date.accessioned2016-10-03T13:28:05Z
dc.date.available2016-10-03T13:28:05Z
dc.date.issued2016
dc.description.abstractДиссертация на соискание ученой степени кандидата технических наук по специальности 05.13.06 – информационные технологии. – Национальный технический университет "Харьковский политехнический институт", Харьков, 2016. Цель диссертационного исследования – создание информационной технологии экстракции бизнес знаний интегрированной корпоративной системы на основе информационно-логических моделей и методов смысловой обработки текстового контента. В работе проанализированы существующие информационные технологии, модели и методы экстракции и идентификации знаний из текстов, сформулированы основные требования к разработке информационного обеспечения подсистемы экстракции бизнес знаний из текстового контента интегрированной корпоративной системы. Обосновано использование инструментов алгебры конечных предикатов в информационно-логических моделях экстракции фактов из текстовых потоков; построена математическая модель генерации фактов из текстов корпорации. Результаты диссертационного исследования внедрены в практику разработки и создания подсистем экстракции знаний из текстового контента реальных ИКС. На основе разработанных в диссертационном исследовании методов и моделей интеллектуальной обработки текстового контента предложена информационная технология формирования единого информационного пространства бизнес деятельности корпорации. При этом под информационным пространством интегрированной корпоративной системы понимается совокупность некоторых актуальных сведений, данных, оформленных таким образом, чтобы обеспечивать качество и оперативность принятия решений в области целевой деятельности корпорации. Предложенная информационная технология позволять извлекать знания из всего многообразия информационных ресурсов современного предприятия: Интернет- и интранет- сайтов предприятий и организаций, почтовых сообщений, файловых систем, хранилищ документов различных ведущих производителей, текстовых полей баз данных, репозитариев, различных бизнес-приложений т. п. Технология включает логико-лингвистическую модель генерации фактов из текстовых потоков ИКС, метод структурирования отношений фактов бизнес знаний, метод выявления актуального множества классифицированных сущностей предметной области, а также специализированные этапы Web Content Mining лингвистического процессора. Разработанные в исследовании математические модели могут быть использованы в различных системах автоматической обработки текстов, системах извлечения знаний, экстракции информации (Information Extraction) и распознавания сущностей (Named Entity Recognition).ru
dc.description.abstractThesis for a candidate degree in technical science, speciality 05.13.06 – Infor-mation Technologies. – National Technical University "Kharkiv Polytechnic Institute". – Kharkiv, 2016. The aim of the thesis is to develop information technology of extraction of business knowledge of integrated corporate system (ICS) based on the information logic models and methods of text content sense processing. The main results are as follows: a logic linguistic model of fact generation from ICS text streams has been developed which is based on surface grammar characteristics of identification of entities of actions and attributes which allows to effectively extract industry specific knowledge about the subjects of monitoring from text content. The thesis further develops the method of comparator identification used for structuring of ICS business knowledge facts relationship. The method allows to classify the attributes of entities according to class relationships due to sense identity of fact triplets which are determined by the comparator objectively. The paper improves the method of determination of actual set of classified entities of a subject domain which is distinguished by an integral use of linguistic, statistical and sense characteristics in the naïve Bayes classifier. The method allows to classify entities extracted according to types determined a priori. The thesis improves the development of information technology of common information space of corporation business activity which allows complicated knowledge generation by means of explicit generalization of information hidden in the collection of partial facts using algebra logic transformations.en
dc.identifier.citationГаутам А. П. С. Информационная технология экстракции бизнес знаний из текстового контента интегрированной корпоративной системы [Электронный ресурс] : дис. ... канд. техн. наук : спец. 05.13.06 / Аджит Пратап Сингх Гаутам ; науч. рук. Шаронова Н. В. ; Нац. техн. ун-т "Харьков. политехн. ин-т". – Харьков, 2016. – 153 с. – Библиогр.: с. 128-142. – рус.ru
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/23555
dc.language.isoru
dc.publisherНТУ "ХПИ"ru
dc.subjectинформационная технологияru
dc.subjectинтегрированная корпоративная системаru
dc.subjectэкстракция бизнес знанийru
dc.subjectидентификация сущностейru
dc.subjectлогико-лингвистические моделиru
dc.subjectдиссертацииru
dc.subjectinformation technologyen
dc.subjectintegrated corporate systemen
dc.subjectbusiness knowledge extractionen
dc.subjectidentification of entitiesen
dc.subjectlogic linguistic modelsen
dc.subject.udc004.912:007.51
dc.titleИнформационная технология экстракции бизнес знаний из текстового контента интегрированной корпоративной системыru
dc.title.alternativeInformation technology of business knowledge extraction from text content of the integrated corporate systemen
dc.typeThesisen
thesis.degree.advisorШаронова Наталья Валерьевнаru
thesis.degree.committeeMemberКуценко Александр Сергеевичru
thesis.degree.committeeMemberГамаюн Игорь Петровичru
thesis.degree.committeeMemberСеверин Валерий Петровичru
thesis.degree.departmentСпециализированный ученый совет Д 64.050.07ru
thesis.degree.discipline05.13.06 – информационные технологииru
thesis.degree.grantorНациональный технический университет "Харьковский политехнический институт"ru
thesis.degree.levelкандидатская диссертацияru
thesis.degree.nameкандидат технических наукru

Файли

Контейнер файлів

Зараз показуємо 1 - 4 з 4
Ескіз
Назва:
titul_dysertatsiia_2016_Gautam_Informatsionnaya.pdf
Розмір:
281.34 KB
Формат:
Adobe Portable Document Format
Опис:
Титульный лист, содержание
Ескіз
Назва:
literatura_dysertatsiia_2016_Gautam_Informatsionnaya.pdf
Розмір:
275.99 KB
Формат:
Adobe Portable Document Format
Опис:
Список использованных источников
Ескіз
Назва:
vidhuk_Asieiev_H_H.pdf
Розмір:
4.03 MB
Формат:
Adobe Portable Document Format
Опис:
Отзыв
Ескіз
Назва:
vidhuk_Chala_L_E.pdf
Розмір:
264.47 KB
Формат:
Adobe Portable Document Format
Опис:
Отзыв

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
11.23 KB
Формат:
Item-specific license agreed upon to submission
Опис: