Please use this identifier to cite or link to this item: http://repository.kpi.kharkov.ua/handle/KhPI-Press/40062
Title: Інформаційна технологія інтелектуального аналізу фактографічних текстових ресурсів
Other Titles: Information Technology of Intellectual Analysis of the Fact-based Text Resourses
Authors: Дорошенко, Анастасія Юріївна
Science degree: кандидат технічних наук
Thesis level: кандидатська дисертація
Code and name of the discipline: 05.13.06 – інформаційні технології
Thesis department: Спеціалізована вчена рада Д 64.050.07
Thesis grantor: Національний технічний університет "Харківський політехнічний інститут"
Scientific advisor: Шаронова Наталія Валеріївна
Committee members: Куценко Олександр Сергійович
Гамаюн Ігор Петрович
Дорофєєв Юрій Іванович
Keywords: інформаційна технологія; фактографічна інформація; метод компараторної ідентифікації; екстракція фактів; онтологічна специфікація; автореферат дисертації; information technology; factual information; comparative identification method; fact extraction; ontological specification
УДК: 004.89:510.635(043.3)
Issue Date: 2019
Publisher: Національний технічний університет "Харківський політехнічний інститут"
Citation: Дорошенко А. Ю. Інформаційна технологія інтелектуального аналізу фактографічних текстових ресурсів [Електронний ресурс] : автореф. дис. ... канд. техн. наук : спец. 05.13.06 / Анастасія Юріївна Дорошенко ; [наук. керівник Шаронова Н. В.] ; Нац. техн. ун-т "Харків. політехн. ін-т". – Харків, 2019. – 24 с. – Бібліогр.: с. 19-21. – укр.
Abstract: Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – інформаційні технології. – Національний технічний університет "Харківський політехнічний інститут", Харків, 2019. У дисертаційній роботі вирішена актуальна науково-практична задача розробки моделей та інформаційної технології інтелектуального аналізу фактографічної інформації. На основі аналізу моделей та методів обробки фактографічних даних у мережевих потоках сформульовано основні вимоги до розробки інформаційної технології інтелектуального аналізу фактографічних ресурсів. У якості математичного інструментарію моделювання фактів визначено теорію категорій, її проективну та предикатну інтерпретації. Запропоновано для опису фактографічної інформації використовувати теорію інтелекту, метод компараторної ідентифікації та апарат алгебрологічних рівнянь. Розроблено моделі тематичного пошуку та екстракції фактографічної інформації на основі інтелектуальної процедури оцінки текстової інформації. Запропоновано для опису фактів використання двох типів триплетів: "Суб'єкт – Предикат – Об'єкт" та "Предмет – Атрибут – Значення", що дозволяє вилучати поняття зі слабоструктурованих текстових ресурсів та описувати відношення між ними у структурованому вигляді. Сформовано підхід до видобування фактографічних даних з текстових джерел, запропоновано використання онтологій для опису процесів інтеграції фактографічної інформації. Запропоновано використання нового напівавтоматичного методу для розширення базової онтології на прикладі предметних областей "радіаційна безпека" та "обробка патентно-кон'юнктурної інформації". Проведено апробацію розроблених моделей, підходів та інформаційної технології та впроваджено результати дослідження у реальні інформаційні системи. Розроблено еталонну архітектуру, програмні компоненти серверної частини програмної системи, що дозволяє проводити екстракцію даних на основі використання гнучкого конфігурування та предикатної моделі видобування даних.
The dissertation for a candidate degree in technical sciences, specialty 05.13.06 – Information Technologies. – National Technical University "Kharkiv Polytechnic Institute", Kharkiv, 2019. The actual scientific and practical task of developing models and information technology of intellectual analysis of factual information is solved in the dissertation. On the basis of analysis of models and methods of processing factual data in network streams, the basic requirements for the development of information technology of intellectual analysis of factual resources are formulated. The theory of categories, its projective and predicate interpretations is determined as a mathematical tool for modeling facts. It is proposed to use the theory of intelligence, the method of comparative identification and the apparatus of algebra-logical equations to describe factual information. Models of thematic search and extraction of factual information on the basis of the intellectual procedure for evaluating textual information have been developed. It is proposed to describe the use of two types of triplets: "Subject – Predicate – Object" and "Item – Attribute – Value", which allows you to remove the concept of weakly structured text resources and describe the relationship between them in a structured form. An approach to extracting factual data from text sources has been formed, and the use of ontologies for the description of the processes of integration of factual information is proposed. The use of a new semi-automatic method is proposed for extending the basic ontology, on the example of the subject areas "radiation safety" and "processing of patent information". Approbation of developed models, approaches and information technology was carried out and the results of research were implemented in real information systems. The reference architecture, software components of the server part of the software system, which allows data extraction based on the use of flexible configuration and predicate data mining model, is developed.
URI: http://repository.kpi.kharkov.ua/handle/KhPI-Press/40062
Appears in Collections:05.13.06 "Інформаційні технології"

Files in This Item:
File Description SizeFormat 
avtoreferat_2019_Doroshenko_Informats_tekhnolohiia.pdf1,2 MBAdobe PDFThumbnail
View/Open
Show full item record  Google Scholar



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.