Идентификация смысловой близости фрагментов текстов наукометрических баз

dc.contributor.authorПетрасова, Светлана Валентиновнаru
dc.contributor.authorХайрова, Нина Феликсовнаru
dc.contributor.authorКиселева, В.ru
dc.date.accessioned2020-05-22T10:27:29Z
dc.date.available2020-05-22T10:27:29Z
dc.date.issued2018
dc.description.abstractСложность анализа текстовой информации, содержащейся в наукометрических системам, определяется многозначностью и синонимичностью, которые свойственны языку на всех уровнях его представления, что, прежде всего, влияет на определение смыслового единства языковых единиц. При этом решение задачи усложняется, если речь идет о смысловой близости крупных информационных фрагментов. Поэтому в связи со стремительным ростом объемов информационных ресурсов в наукометрических системах и существующими подходами и методами анализа слабоформализованных данных становятся перспективными задачи обработки текстовой информации на базе интеллектуального анализа. В работе рассматривается информационная технология идентификации смысловой близости фрагментов текстов наукометрических систем. Предложенная технология позволяет определять общие информационные пространства научного взаимодействия авторов за счет идентификации семантически эквивалентных коллокаций в текстах. Технология включает модель формального описания семантико-грамматических характеристик слов атрибутивных, глагольных и субстантивных коллокаций и определение предиката семантической эквивалентности двухсловных коллокаций на основе уравнений алгебры конечных предикатов. Программная имплементация модели представляет собой веб-приложение, определяющее семантически близкие текстовые фрагменты статей, индексируемых в наукометрических базах Google Scholar и Science Direct. В результате определяется эвристическая оценка эффективности разработанной технологии для каждого типа коллокаций.ru
dc.description.abstractThis paper considers the information technology for identification of semantic similarity of text fragments in scientometric systems. The proposed technology allows determining common information spaces of authors’ scientific interaction due to identification of semantic equivalence of collocations in texts. The technology includes a model for a formal description of the semantic and grammatical characteristics of words in attributive, verbal and substantive collocations and identification of the semantic equivalence predicate for two-word collocations based on the algebra of finite predicates. The developed software implementation is a web application that defines semantically connected text fragments of articles indexed in Google Scholar and Science Direct. As a result, an effectiveness estimate of the developed technology for each type of collocations is determined.en
dc.identifier.citationПетрасова С. Идентификация смысловой близости фрагментов текстов наукометрических баз / С. Петрасова, Н. Хайрова, В. Киселева // Information Technologies and Knowledge. – 2018. – Vol. 12, № 1. – P. 32-42.ru
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/46381
dc.language.isoru
dc.publisherITHEA, Bulgariaen
dc.subjectнаукометрические базыru
dc.subjectсемантическая близостьru
dc.subjectинформационное пространствоru
dc.subjectсинонимия коллокацийru
dc.subjectалгебра конечных предикатовru
dc.subjectscientometric basesen
dc.subjectsemantic similarityen
dc.subjectinformation spaceen
dc.subjectcollocation synonymyen
dc.subjectalgebra of finite predicatesen
dc.titleИдентификация смысловой близости фрагментов текстов наукометрических базru
dc.title.alternativeIdentification of Semantic Similarity of Text Fragments in Scientometric Basesen
dc.typeArticleen

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
ITK_2018_12_1_Petrasova_Identifikatsiya.pdf
Розмір:
638.28 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
11.25 KB
Формат:
Item-specific license agreed upon to submission
Опис: