Інформаційна технологія інтелектуального аналізу фактографічних текстових ресурсів
Дата
2019
Автори
ORCID
DOI
item.page.thesis.degree.name
кандидат технічних наук
item.page.thesis.degree.level
кандидатська дисертація
item.page.thesis.degree.discipline
05.13.06 – інформаційні технології
item.page.thesis.degree.department
Спеціалізована вчена рада Д 64.050.07
item.page.thesis.degree.grantor
Національний технічний університет "Харківський політехнічний інститут"
item.page.thesis.degree.advisor
Шаронова Наталія Валеріївна
item.page.thesis.degree.committeeMember
Куценко Олександр Сергійович
Гамаюн Ігор Петрович
Дорофєєв Юрій Іванович
Гамаюн Ігор Петрович
Дорофєєв Юрій Іванович
Назва журналу
Номер ISSN
Назва тому
Видавець
Національний технічний університет "Харківський політехнічний інститут"
Анотація
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – інформаційні технології. – Національний технічний університет "Харківський політехнічний інститут", Харків, 2019.
У дисертаційній роботі вирішена актуальна науково-практична задача розробки моделей та інформаційної технології інтелектуального аналізу фактографічної інформації. На основі аналізу моделей та методів обробки фактографічних даних у мережевих потоках сформульовано основні вимоги до розробки інформаційної технології інтелектуального аналізу фактографічних ресурсів. У якості математичного інструментарію моделювання фактів визначено теорію категорій, її проективну та предикатну інтерпретації. Запропоновано для опису фактографічної інформації використовувати теорію інтелекту, метод компараторної ідентифікації та апарат алгебрологічних рівнянь. Розроблено моделі тематичного пошуку та екстракції фактографічної інформації на основі інтелектуальної процедури оцінки текстової інформації. Запропоновано для опису фактів використання двох типів триплетів: "Суб'єкт – Предикат – Об'єкт" та "Предмет – Атрибут – Значення", що дозволяє вилучати поняття зі слабоструктурованих текстових ресурсів та описувати відношення між ними у структурованому вигляді. Сформовано підхід до видобування фактографічних даних з текстових джерел, запропоновано використання онтологій для опису процесів інтеграції фактографічної інформації. Запропоновано використання нового напівавтоматичного методу для розширення базової онтології на прикладі предметних областей "радіаційна безпека" та "обробка патентно-кон'юнктурної інформації". Проведено апробацію розроблених моделей, підходів та інформаційної технології та впроваджено результати дослідження у реальні інформаційні системи. Розроблено еталонну архітектуру, програмні компоненти серверної частини програмної системи, що дозволяє проводити екстракцію даних на основі використання гнучкого конфігурування та предикатної моделі видобування даних.
The dissertation for a candidate degree in technical sciences, specialty 05.13.06 – Information Technologies. – National Technical University "Kharkiv Polytechnic Institute", Kharkiv, 2019. The actual scientific and practical task of developing models and information technology of intellectual analysis of factual information is solved in the dissertation. On the basis of analysis of models and methods of processing factual data in network streams, the basic requirements for the development of information technology of intellectual analysis of factual resources are formulated. The theory of categories, its projective and predicate interpretations is determined as a mathematical tool for modeling facts. It is proposed to use the theory of intelligence, the method of comparative identification and the apparatus of algebra-logical equations to describe factual information. Models of thematic search and extraction of factual information on the basis of the intellectual procedure for evaluating textual information have been developed. It is proposed to describe the use of two types of triplets: "Subject – Predicate – Object" and "Item – Attribute – Value", which allows you to remove the concept of weakly structured text resources and describe the relationship between them in a structured form. An approach to extracting factual data from text sources has been formed, and the use of ontologies for the description of the processes of integration of factual information is proposed. The use of a new semi-automatic method is proposed for extending the basic ontology, on the example of the subject areas "radiation safety" and "processing of patent information". Approbation of developed models, approaches and information technology was carried out and the results of research were implemented in real information systems. The reference architecture, software components of the server part of the software system, which allows data extraction based on the use of flexible configuration and predicate data mining model, is developed.
The dissertation for a candidate degree in technical sciences, specialty 05.13.06 – Information Technologies. – National Technical University "Kharkiv Polytechnic Institute", Kharkiv, 2019. The actual scientific and practical task of developing models and information technology of intellectual analysis of factual information is solved in the dissertation. On the basis of analysis of models and methods of processing factual data in network streams, the basic requirements for the development of information technology of intellectual analysis of factual resources are formulated. The theory of categories, its projective and predicate interpretations is determined as a mathematical tool for modeling facts. It is proposed to use the theory of intelligence, the method of comparative identification and the apparatus of algebra-logical equations to describe factual information. Models of thematic search and extraction of factual information on the basis of the intellectual procedure for evaluating textual information have been developed. It is proposed to describe the use of two types of triplets: "Subject – Predicate – Object" and "Item – Attribute – Value", which allows you to remove the concept of weakly structured text resources and describe the relationship between them in a structured form. An approach to extracting factual data from text sources has been formed, and the use of ontologies for the description of the processes of integration of factual information is proposed. The use of a new semi-automatic method is proposed for extending the basic ontology, on the example of the subject areas "radiation safety" and "processing of patent information". Approbation of developed models, approaches and information technology was carried out and the results of research were implemented in real information systems. The reference architecture, software components of the server part of the software system, which allows data extraction based on the use of flexible configuration and predicate data mining model, is developed.
Опис
Ключові слова
інформаційна технологія, фактографічна інформація, метод компараторної ідентифікації, екстракція фактів, онтологічна специфікація, автореферат дисертації, information technology, factual information, comparative identification method, fact extraction, ontological specification
Бібліографічний опис
Дорошенко А. Ю. Інформаційна технологія інтелектуального аналізу фактографічних текстових ресурсів [Електронний ресурс] : автореф. дис. ... канд. техн. наук : спец. 05.13.06 / Анастасія Юріївна Дорошенко ; [наук. керівник Шаронова Н. В.] ; Нац. техн. ун-т "Харків. політехн. ін-т". – Харків, 2019. – 24 с. – Бібліогр.: с. 19-21. – укр.