Метод автоматичного визначення семантично близьких фрагментів новинних текстів

Петрасова, Світлана Валентинівна; Галкіна, Яна Романівна; Мануйлов, Ілля Олександрович; Бородіна, Олександра Русланівна; Швець, Софія Ігорівна

doi:https://doi.org/10.20998/2227-6890.2019.01.17

Метод автоматичного визначення семантично близьких фрагментів новинних текстів

dc.contributor.author	Петрасова, Світлана Валентинівна	uk
dc.contributor.author	Галкіна, Яна Романівна	uk
dc.contributor.author	Мануйлов, Ілля Олександрович	uk
dc.contributor.author	Бородіна, Олександра Русланівна	uk
dc.contributor.author	Швець, Софія Ігорівна	uk
dc.date.accessioned	2020-06-12T10:44:39Z
dc.date.available	2020-06-12T10:44:39Z
dc.date.issued	2019
dc.description.abstract	Складність семантичного аналізу текстової інформації, що міститься в новинних повідомленнях, визначається багатозначністю і синонімічністю, які властиві мові на всіх рівнях її представлення, що, перш за все, впливає на визначення смислово ї близькості мовних одиниць. Виявлення семантично близьких фрагментів текстів або перефразувань є актуальною проблемою у таких наукових напрямках як семантичний пошук інформації, видобування інформації, машинний переклад, визначення порушень авторських прав і т.п. , крім того широко використовується при рерайтингу. У статті проаналізовано основні проблеми рерайтинга, зокрема перефразування синтаксичних одиниць тексту зі збереженням смислового навантаження. Розглянуто сучасні методи визначення семантичної близькості слів, вказано основні переваги та недоліки. Запропоновано метод автоматичного виявлення синонімічних фрагментів новинних текстів на основі використання WordNet та розроблених синтаксичних правил, які зберігають інформацію про граматичні характеристики слів. Перевагою даного методу є те, що аналізується як граматична структура мови, так і смисл слів. Досліджуваний корпус представлено новинними текстами інформаційного агентства Reuters, служб CNN і BBC World News. Запропонований метод ідентифікації семантично зв’язних фрагментів тексту дозволяє виявити спільний інформаційний простір актуальних новин та може використовуватися для ефективного визначення близьких за змістом текстів в інформаційно-пошукових, експертних, аналітичних інформаційних системах. Вирішення завдання автоматичного визначення семантичної близькості може застосовуватися при автоматизованій побудові онтологій по тексту, для розширення існуючих і створення нових тезаурусів.	uk
dc.identifier.citation	Метод автоматичного визначення семантично близьких фрагментів новинних текстів / С. В. Петрасова [та ін.] // Вісник Національного технічного університету "ХПІ". Сер. : Актуальні проблеми розвитку українського суспільства = Bulletin of the National Technical University "KhPI". Ser. : Actual problems of Ukrainian society development : зб. наук. пр. – Харків : НТУ "ХПІ", 2019. – № 1. – С. 98-102.	uk
dc.identifier.doi	https://doi.org/10.20998/2227-6890.2019.01.17
dc.identifier.orcid	https://orcid.org/0000-0001-6011-135X
dc.identifier.uri	https://repository.kpi.kharkov.ua/handle/KhPI-Press/46902
dc.language.iso	uk
dc.publisher	Національний технічний університет "Харківський політехнічний інститут"	uk
dc.subject	семантика	uk
dc.subject	тексти	uk
dc.subject	структура текстів	uk
dc.subject	рерайтинг	uk
dc.subject	перефразування	uk
dc.subject	онтологія	uk
dc.subject	тезаурус	uk
dc.subject	семантична близькість слів	uk
dc.subject	новинні тексти	uk
dc.title	Метод автоматичного визначення семантично близьких фрагментів новинних текстів	uk
dc.title.alternative	Method for automatic identification of semantically similar fragments of news texts	en
dc.type	Article	en

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: vestnik_KhPI_2019_1_Petrasova_Metod.pdf
Розмір:: 606,6 KB
Формат:: Adobe Portable Document Format
Опис:

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 1,71 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Колекції

Вісник № 01. Актуальні проблеми розвитку українського суспільства
Кафедра "Інтелектуальні комп'ютерні системи"