Інформаційна технологія інтелектуального аналізу фактографічних текстових ресурсів

dc.contributor.authorДорошенко, Анастасія Юріївнаuk
dc.date.accessioned2019-03-05T10:09:54Z
dc.date.available2019-03-05T10:09:54Z
dc.date.issued2019
dc.description.abstractДисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – інформаційні технології. – Національний технічний університет "Харківський політехнічний інститут", Харків, 2019. У дисертаційній роботі вирішена актуальна науково-практична задача розробки моделей та інформаційної технології інтелектуального аналізу фактографічної інформації. На основі аналізу моделей та методів обробки фактографічних даних у мережевих потоках сформульовано основні вимоги до розробки інформаційної технології інтелектуального аналізу фактографічних ресурсів. У якості математичного інструментарію моделювання фактів визначено теорію категорій, її проективну та предикатну інтерпретації. Запропоновано для опису фактографічної інформації використовувати теорію інтелекту, метод компараторної ідентифікації та апарат алгебрологічних рівнянь. Розроблено моделі тематичного пошуку та екстракції фактографічної інформації на основі інтелектуальної процедури оцінки текстової інформації. Запропоновано для опису фактів використання двох типів триплетів: "Суб'єкт – Предикат – Об'єкт" та "Предмет – Атрибут – Значення", що дозволяє вилучати поняття зі слабоструктурованих текстових ресурсів та описувати відношення між ними у структурованому вигляді. Сформовано підхід до видобування фактографічних даних з текстових джерел, запропоновано використання онтологій для опису процесів інтеграції фактографічної інформації. Запропоновано використання нового напівавтоматичного методу для розширення базової онтології на прикладі предметних областей "радіаційна безпека" та "обробка патентно-кон'юнктурної інформації". Проведено апробацію розроблених моделей, підходів та інформаційної технології та впроваджено результати дослідження у реальні інформаційні системи. Розроблено еталонну архітектуру, програмні компоненти серверної частини програмної системи, що дозволяє проводити екстракцію даних на основі використання гнучкого конфігурування та предикатної моделі видобування даних.uk
dc.description.abstractThe dissertation for a candidate degree in technical sciences, specialty 05.13.06 – Information Technologies. – National Technical University "Kharkiv Polytechnic Institute", Kharkiv, 2019. The actual scientific and practical task of developing models and information technology of intellectual analysis of factual information is solved in the dissertation. On the basis of analysis of models and methods of processing factual data in network streams, the basic requirements for the development of information technology of intellectual analysis of factual resources are formulated. The theory of categories, its projective and predicate interpretations is determined as a mathematical tool for modeling facts. It is proposed to use the theory of intelligence, the method of comparative identification and the apparatus of algebra-logical equations to describe factual information. Models of thematic search and extraction of factual information on the basis of the intellectual procedure for evaluating textual information have been developed. It is proposed to describe the use of two types of triplets: "Subject – Predicate – Object" and "Item – Attribute – Value", which allows you to remove the concept of weakly structured text resources and describe the relationship between them in a structured form. An approach to extracting factual data from text sources has been formed, and the use of ontologies for the description of the processes of integration of factual information is proposed. The use of a new semi-automatic method is proposed for extending the basic ontology, on the example of the subject areas "radiation safety" and "processing of patent information". Approbation of developed models, approaches and information technology was carried out and the results of research were implemented in real information systems. The reference architecture, software components of the server part of the software system, which allows data extraction based on the use of flexible configuration and predicate data mining model, is developed.en
dc.identifier.citationДорошенко А. Ю. Інформаційна технологія інтелектуального аналізу фактографічних текстових ресурсів [Електронний ресурс] : автореф. дис. ... канд. техн. наук : спец. 05.13.06 / Анастасія Юріївна Дорошенко ; [наук. керівник Шаронова Н. В.] ; Нац. техн. ун-т "Харків. політехн. ін-т". – Харків, 2019. – 24 с. – Бібліогр.: с. 19-21. – укр.uk
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/40062
dc.language.isouk
dc.publisherНаціональний технічний університет "Харківський політехнічний інститут"uk
dc.subjectінформаційна технологіяuk
dc.subjectфактографічна інформаціяuk
dc.subjectметод компараторної ідентифікаціїuk
dc.subjectекстракція фактівuk
dc.subjectонтологічна специфікаціяuk
dc.subjectавтореферат дисертаціїuk
dc.subjectinformation technologyen
dc.subjectfactual informationen
dc.subjectcomparative identification methoden
dc.subjectfact extractionen
dc.subjectontological specificationen
dc.subject.udc004.89:510.635(043.3)
dc.titleІнформаційна технологія інтелектуального аналізу фактографічних текстових ресурсівuk
dc.title.alternativeInformation Technology of Intellectual Analysis of the Fact-based Text Resoursesen
dc.typeThesisen
thesis.degree.advisorШаронова Наталія Валеріївнаuk
thesis.degree.committeeMemberКуценко Олександр Сергійовичuk
thesis.degree.committeeMemberГамаюн Ігор Петровичuk
thesis.degree.committeeMemberДорофєєв Юрій Івановичuk
thesis.degree.departmentСпеціалізована вчена рада Д 64.050.07uk
thesis.degree.discipline05.13.06 – інформаційні технологіїuk
thesis.degree.grantorНаціональний технічний університет "Харківський політехнічний інститут"uk
thesis.degree.levelкандидатська дисертаціяuk
thesis.degree.nameкандидат технічних наукuk

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Ескіз
Назва:
avtoreferat_2019_Doroshenko_Informats_tekhnolohiia.pdf
Розмір:
1.17 MB
Формат:
Adobe Portable Document Format
Опис:

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
11.23 KB
Формат:
Item-specific license agreed upon to submission
Опис: