Sentiment analysis of texts using recurrent neural networks of the transformer architecture
| dc.contributor.author | Lashyn, Yaroslav | |
| dc.contributor.author | Trofymchuk, Oleksandr | |
| dc.contributor.author | Zabolotnyi, Serhii | |
| dc.contributor.author | Voitko, Oleksandr | |
| dc.contributor.author | Seabra, Eurico | |
| dc.date.accessioned | 2025-08-22T07:09:02Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | This study focuses on the automated process of determining sentiment (emotional coloring) in text messages from Telegram channels to enhance Ukraine’s information security. The principal challenge addressed lies in the need for rapid and accurate detection of negative, positive, or neutral messages within large-scale data streams without additional fine-tuning on local datasets. The essence of the results obtained is the implementation of a zero-shot classification approach, based on the multilingual transformer model XLM-RoBERTa, which in the experiment yielded the following metrics: Accuracy = 0.4718, Precision = 0.7138, Recall = 0.4718, and F1 Score = 0.5044. Owing to the model’s strong ability to generalize lexico-semantic patterns, a stable compromise between Precision and Recall was achieved, thereby increasing the efficiency of message analysis in large data volumes. These results are explained by the architectural features of XLM-RoBERTa, primarily its multilingual nature and deep layer structure, which enable proper handling of multilingual texts without dedicated local training. | |
| dc.description.abstract | Об’єктом дослідження є процес автоматизованого визначення тональності (емоційного забарвлення) текстових повідомлень із Telegram-каналів у контексті підвищення рівня інформаційної безпеки України. Проблема, що вирішувалася, полягає в необхідності швидкого та точного виявлення негативних, позитивних чи нейтральних повідомлень у масштабних потоках даних без додаткового донавчання на локальних вибірках. Суть отриманих результатів полягає у впровадженні підходу zero-shot класифікації (класифікація без попереднього донавчання моделі) на основі багатомовної трансформерної моделі XLM-RoBERTa, яка під час експерименту продемонструвала такі показники: точність (Accuracy) = 0.4718, прецизійність (Precision) = 0.7138, повнота (Recall) = 0.4718 та F1-міра (F1 Score) = 0.5044. Завдяки високій здатності моделі узагальнювати лексико-семантичні патерни вдалося досягти стабільного компромісу між точністю (Precision) і повнотою (Recall), що підвищує ефективність аналізу повідомлень у великому масиві даних. Такі результати пояснюються архітектурними особливостями XLM-RoBERTa, насамперед багатомовністю та глибинною структурою шарів, які забезпечують коректне опрацювання багатомовних текстів без цілеспрямованого локального тренування. | |
| dc.identifier.citation | Sentiment analysis of texts using recurrent neural networks of the transformer architecture / Y. Lashyn [et al.] // Сучасні інформаційні системи = Advanced Information Systems. – 2025. – Т. 9, № 3. – С. 91-101. | |
| dc.identifier.doi | https://doi.org/10.20998/2522-9052.2025.3.11 | |
| dc.identifier.orcid | https://orcid.org/0009-0000-5533-9210 | |
| dc.identifier.orcid | https://orcid.org/0000-0003-3358-6274 | |
| dc.identifier.orcid | https://orcid.org/0009-0000-1381-0510 | |
| dc.identifier.orcid | https://orcid.org/0000-0002-4610-4476 | |
| dc.identifier.orcid | https://orcid.org/0000-0002-1728-2839 | |
| dc.identifier.uri | https://repository.kpi.kharkov.ua/handle/KhPI-Press/92357 | |
| dc.language.iso | en | |
| dc.publisher | Національний технічний університет "Харківський політехнічний інститут" | |
| dc.subject | information security | |
| dc.subject | information space monitoring | |
| dc.subject | information threat | |
| dc.subject | sentiment analysis | |
| dc.subject | transformer-based models | |
| dc.subject | recurrent neural networks | |
| dc.subject | інформаційна безпека | |
| dc.subject | моніторинг інформаційного простору | |
| dc.subject | інформаційна загроза | |
| dc.subject | аналіз тональності | |
| dc.subject | трансформерні моделі | |
| dc.subject | рекурентні нейронні мережі | |
| dc.title | Sentiment analysis of texts using recurrent neural networks of the transformer architecture | |
| dc.title.alternative | Аналіз тональності текстів з використанням рекурентних нейронних мереж трансформерної архітектури | |
| dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- AIS_2025_9_3_Lashyn_Sentiment_analysis.pdf
- Розмір:
- 592.49 KB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Вантажиться...
- Назва:
- license.txt
- Розмір:
- 2.95 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис:
