Идентификация смысловой близости фрагментов текстов наукометрических баз

Петрасова, Светлана Валентиновна; Хайрова, Нина Феликсовна; Киселева, В.

Идентификация смысловой близости фрагментов текстов наукометрических баз

dc.contributor.author	Петрасова, Светлана Валентиновна	ru
dc.contributor.author	Хайрова, Нина Феликсовна	ru
dc.contributor.author	Киселева, В.	ru
dc.date.accessioned	2020-05-22T10:27:29Z
dc.date.available	2020-05-22T10:27:29Z
dc.date.issued	2018
dc.description.abstract	Сложность анализа текстовой информации, содержащейся в наукометрических системам, определяется многозначностью и синонимичностью, которые свойственны языку на всех уровнях его представления, что, прежде всего, влияет на определение смыслового единства языковых единиц. При этом решение задачи усложняется, если речь идет о смысловой близости крупных информационных фрагментов. Поэтому в связи со стремительным ростом объемов информационных ресурсов в наукометрических системах и существующими подходами и методами анализа слабоформализованных данных становятся перспективными задачи обработки текстовой информации на базе интеллектуального анализа. В работе рассматривается информационная технология идентификации смысловой близости фрагментов текстов наукометрических систем. Предложенная технология позволяет определять общие информационные пространства научного взаимодействия авторов за счет идентификации семантически эквивалентных коллокаций в текстах. Технология включает модель формального описания семантико-грамматических характеристик слов атрибутивных, глагольных и субстантивных коллокаций и определение предиката семантической эквивалентности двухсловных коллокаций на основе уравнений алгебры конечных предикатов. Программная имплементация модели представляет собой веб-приложение, определяющее семантически близкие текстовые фрагменты статей, индексируемых в наукометрических базах Google Scholar и Science Direct. В результате определяется эвристическая оценка эффективности разработанной технологии для каждого типа коллокаций.	ru
dc.description.abstract	This paper considers the information technology for identification of semantic similarity of text fragments in scientometric systems. The proposed technology allows determining common information spaces of authors’ scientific interaction due to identification of semantic equivalence of collocations in texts. The technology includes a model for a formal description of the semantic and grammatical characteristics of words in attributive, verbal and substantive collocations and identification of the semantic equivalence predicate for two-word collocations based on the algebra of finite predicates. The developed software implementation is a web application that defines semantically connected text fragments of articles indexed in Google Scholar and Science Direct. As a result, an effectiveness estimate of the developed technology for each type of collocations is determined.	en
dc.identifier.citation	Петрасова С. Идентификация смысловой близости фрагментов текстов наукометрических баз / С. Петрасова, Н. Хайрова, В. Киселева // Information Technologies and Knowledge. – 2018. – Vol. 12, № 1. – P. 32-42.	ru
dc.identifier.uri	https://repository.kpi.kharkov.ua/handle/KhPI-Press/46381
dc.language.iso	ru
dc.publisher	ITHEA, Bulgaria	en
dc.subject	наукометрические базы	ru
dc.subject	семантическая близость	ru
dc.subject	информационное пространство	ru
dc.subject	синонимия коллокаций	ru
dc.subject	алгебра конечных предикатов	ru
dc.subject	scientometric bases	en
dc.subject	semantic similarity	en
dc.subject	information space	en
dc.subject	collocation synonymy	en
dc.subject	algebra of finite predicates	en
dc.title	Идентификация смысловой близости фрагментов текстов наукометрических баз	ru
dc.title.alternative	Identification of Semantic Similarity of Text Fragments in Scientometric Bases	en
dc.type	Article	en

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: ITK_2018_12_1_Petrasova_Identifikatsiya.pdf
Розмір:: 638.28 KB
Формат:: Adobe Portable Document Format
Опис:

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 11.25 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Кафедра "Інтелектуальні комп'ютерні системи"