Sentiment analysis of texts using recurrent neural networks of the transformer architecture

dc.contributor.authorLashyn, Yaroslav
dc.contributor.authorTrofymchuk, Oleksandr
dc.contributor.authorZabolotnyi, Serhii
dc.contributor.authorVoitko, Oleksandr
dc.contributor.authorSeabra, Eurico
dc.date.accessioned2025-08-22T07:09:02Z
dc.date.issued2025
dc.description.abstractThis study focuses on the automated process of determining sentiment (emotional coloring) in text messages from Telegram channels to enhance Ukraine’s information security. The principal challenge addressed lies in the need for rapid and accurate detection of negative, positive, or neutral messages within large-scale data streams without additional fine-tuning on local datasets. The essence of the results obtained is the implementation of a zero-shot classification approach, based on the multilingual transformer model XLM-RoBERTa, which in the experiment yielded the following metrics: Accuracy = 0.4718, Precision = 0.7138, Recall = 0.4718, and F1 Score = 0.5044. Owing to the model’s strong ability to generalize lexico-semantic patterns, a stable compromise between Precision and Recall was achieved, thereby increasing the efficiency of message analysis in large data volumes. These results are explained by the architectural features of XLM-RoBERTa, primarily its multilingual nature and deep layer structure, which enable proper handling of multilingual texts without dedicated local training.
dc.description.abstractОб’єктом дослідження є процес автоматизованого визначення тональності (емоційного забарвлення) текстових повідомлень із Telegram-каналів у контексті підвищення рівня інформаційної безпеки України. Проблема, що вирішувалася, полягає в необхідності швидкого та точного виявлення негативних, позитивних чи нейтральних повідомлень у масштабних потоках даних без додаткового донавчання на локальних вибірках. Суть отриманих результатів полягає у впровадженні підходу zero-shot класифікації (класифікація без попереднього донавчання моделі) на основі багатомовної трансформерної моделі XLM-RoBERTa, яка під час експерименту продемонструвала такі показники: точність (Accuracy) = 0.4718, прецизійність (Precision) = 0.7138, повнота (Recall) = 0.4718 та F1-міра (F1 Score) = 0.5044. Завдяки високій здатності моделі узагальнювати лексико-семантичні патерни вдалося досягти стабільного компромісу між точністю (Precision) і повнотою (Recall), що підвищує ефективність аналізу повідомлень у великому масиві даних. Такі результати пояснюються архітектурними особливостями XLM-RoBERTa, насамперед багатомовністю та глибинною структурою шарів, які забезпечують коректне опрацювання багатомовних текстів без цілеспрямованого локального тренування.
dc.identifier.citationSentiment analysis of texts using recurrent neural networks of the transformer architecture / Y. Lashyn [et al.] // Сучасні інформаційні системи = Advanced Information Systems. – 2025. – Т. 9, № 3. – С. 91-101.
dc.identifier.doihttps://doi.org/10.20998/2522-9052.2025.3.11
dc.identifier.orcidhttps://orcid.org/0009-0000-5533-9210
dc.identifier.orcidhttps://orcid.org/0000-0003-3358-6274
dc.identifier.orcidhttps://orcid.org/0009-0000-1381-0510
dc.identifier.orcidhttps://orcid.org/0000-0002-4610-4476
dc.identifier.orcidhttps://orcid.org/0000-0002-1728-2839
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/92357
dc.language.isoen
dc.publisherНаціональний технічний університет "Харківський політехнічний інститут"
dc.subjectinformation security
dc.subjectinformation space monitoring
dc.subjectinformation threat
dc.subjectsentiment analysis
dc.subjecttransformer-based models
dc.subjectrecurrent neural networks
dc.subjectінформаційна безпека
dc.subjectмоніторинг інформаційного простору
dc.subjectінформаційна загроза
dc.subjectаналіз тональності
dc.subjectтрансформерні моделі
dc.subjectрекурентні нейронні мережі
dc.titleSentiment analysis of texts using recurrent neural networks of the transformer architecture
dc.title.alternativeАналіз тональності текстів з використанням рекурентних нейронних мереж трансформерної архітектури
dc.typeArticle

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
AIS_2025_9_3_Lashyn_Sentiment_analysis.pdf
Розмір:
592.49 KB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
license.txt
Розмір:
2.95 KB
Формат:
Item-specific license agreed upon to submission
Опис: