Інформаційна технологія ідентифікації знань у наукометричних системах на основі інтелектуального аналізу слабоформалізованих даних

Вантажиться...
Ескіз

Дата

2016

ORCID

DOI

Науковий ступінь

кандидат технічних наук

Рівень дисертації

кандидатська дисертація

Шифр та назва спеціальності

05.13.06 – інформаційні технології

Рада захисту

Спеціалізована вчена рада Д 64.050.07

Установа захисту

Національний технічний університет "Харківський політехнічний інститут"

Науковий керівник

Хайрова Ніна Феліксівна

Члени комітету

Куценко Олександр Сергійович
Гамаюн Ігор Петрович
Северин Валерій Петрович

Видавець

НТУ "ХПІ"

Анотація

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – інформаційні технології. – Національний технічний університет "Харківський політехнічний інститут", Харків, 2017. Мета дисертаційного дослідження – підвищення ефективності процесу ідентифікації знань у наукометричних системах за рахунок побудови моделей і методів інтелектуального аналізу слабоформалізованих даних. Основні результати: уперше розроблено логіко-лінгвістичну модель визначення семантично зв'язних фрагментів слабоформалізованої реферативної інформації, яка заснована на використанні алгебро-предикатних операцій, що дозволяє ефективно ідентифікувати знання у реферативній інформації. Удосконалено метод формалізації смислових відношень сутностей, який базується на використанні міри смислової близькості та відрізняється застосуванням інтелектуального аналізу при виявленні класів еквівалентності та толерантності, що дозволяє визначити неявно виражені відношення близькості й відношення таксономії. Отримав по-дальший розвиток метод компараторної ідентифікації, який використано для класифікації смислових фрагментів рефератів у наукометричних системах що дозволяє виділити єдині інформаційні простори наукової взаємодії авторів за рахунок моделювання функцій інтелекту з розуміння та класифікації смислу. Удосконалено інформаційну технологію ідентифікації знань у наукометричних системах, яка дозволяє за рахунок визначення імпліцитних зв'язків між рефератами наукометричних систем динамічно виявляти спільні фронти наукових досліджень. Результати дослідження знайшли практичне застосування у системах обробки анотацій та рефератів. Використання розроблених у роботі моделей і методів дозволило підвищити ефективність процесу ідентифікації знань у слабоформалізованій реферативній інформації за рахунок підвищення значень коефіцієнтів повноти й точності видачі близької за смислом інформації.
Thesis for a candidate degree in technical sciences, speciality 05.13.06 – Information Technologies. – National Technical University "Kharkiv Polytechnic Institute". – Kharkiv, 2017. The objective of the thesis is to increase the effectiveness of knowledge identi-fication in scientometric systems by designing the models and methods of intelligent analysis of weakly formalized data. The main results are as follows. The current state of the knowledge identification problem in scientometric systems has been analysed. Existing methods for the intelligent analysis of weakly formalized data have been systematized. Thus the basic requirements for designing the information technology of knowledge identification have been formulated. Using the finite predicate algebra in the information and logical models of knowledge identification in Ukrainian and English abstract data of scientometric systems has been proved. The logical-linguistic model of semantically connected fragments identification in weakly formalized abstract information has been developed. The model is based on the use of algebraic-predicate operations that allows effectively extracting knowledge from abstract information. The method for the formalization of semantic relations between entities has been improved. The method is based on the use of the semantic similarity measure and intelligent analysis for the identification of equivalence and tolerance classes that allows defining implicit relations of similarity and relations of taxonomy. The method for comparator identification has got the further development. This method is used to classify abstract fragments in scientometric systems that allows determining common information spaces of scientific interaction by modelling intel-ligence functions of understanding and classification of sense. The information technology of knowledge identification in scientometric systems has been improved. The technology allows identifying common research fronts by defining dynamically implicit connections between abstracts of scientometric systems. The research results have been implemented in the systems of summaries and abstracts processing. Using the developed information technology improves the effectiveness of knowledge identification in weakly formalized data by increasing the average values of the precision and recall measures of semantic similarity of text information. The practical results can be used in information retrieval, expert, and information-analytical general-purpose systems for the formation of electronic catalogues of semantically connected texts in scientometric, library, and abstract systems.

Опис

Ключові слова

інформаційна технологія, ідентифікація знань, науко-метрична система, логіко-лінгвістична модель, реферативна інформація, смислові відношення, дисертації, information technology, knowledge identification, scientometric system, logical-linguistic model, abstract information, semantic relations

Бібліографічний опис

Петрасова С. В. Інформаційна технологія ідентифікації знань у наукометричних системах на основі інтелектуального аналізу слабоформалізованих даних [Електронний ресурс] : дис. ... канд. техн. наук : спец. 05.13.06 / Світлана Валентинівна Петрасова ; наук. керівник Хайрова Н. Ф. ; Нац. техн. ун-т "Харків. політехн. ін-т". – Харків, 2016. – 145 с. – Бібліогр.: с. 117-131. – укр.