Please use this identifier to cite or link to this item: http://repository.kpi.kharkov.ua/handle/KhPI-Press/52495
Title: International system of knowledge exchange for young scientists
Other Titles: Система обміну знаннями молодих науковців із різних країн
Authors: Barkovska, Olesia
Kholiev, Vladyslav
Pyvovarova, Daria
Ivaschenko, Georgiy
Rosinskiy, Dmytro
Keywords: classification; preprocessing; lemmatization; stemming; класифікація; попередня обробка; лематизація; стемінг
Issue Date: 2021
Publisher: Національний технічний університет "Харківський політехнічний інститут"
Citation: International system of knowledge exchange for young scientists / O. Barkovska [et al.] // Сучасні інформаційні системи = Advanced Information Systems. – 2021. – Т. 5, № 1. – С. 69-74.
Abstract: The paper proposes a system which is electronic data storage (of qualification works of students from different countries) and provides the capability to identify and connect young scientists conducting research on a related problem area. The purpose of developing this system is to provide opportunities for knowledge exchange, research in a team on a common problem, as well as to identify scientific trends in different countries. In this paper, the preprocessing methods influence on the work of classifiers such as Logistic Regression, LSTM, BERT, LightGBM was researched. A study was conducted on the speed of classification and F1 assessment. Conclusions. Lemmatization showed to require a shorter oper ating time compared to steaming by almost twice and a better score by an average of 5 percent, so it was decided to use the Logistic Regression classifier with lemmatization at the stage of text preparation in the subsequent operation of the proposed ISKE.
У роботі запропонована система, яка являє електронне сховище даних (кваліфікаційних робіт студентів із різних країн) та забезпечує можливість виявити та зв’язати між собою молодих вчених, що ведуть дослідження над єдиною проблемною областю. Метою розробки даної системи є забезпечення можливості обміну знаннями, виконання досліджень у команді над спільною проблемою, а також визначення наукових тенденцій у різних країнах світу. У роботі досліджено вплив методів препроцесінгу на роботу таких класифікаторів, як Logistic Regression, LSTM, BERT, LightGBM. Проведено дослідження щодо швидкості класифікації та F1 оцінки. Висновки. Лематизація показала коротший час роботи у порівнянні зі стемінгом майже в два рази та кращу оцінку в середньому на 5 відсотків, тому було прийнято рішення використовувати класифікатор Logistic Regression із лематизацією на етапі підготовки тексту у подальшій роботі запропонованої системи обміну знаннями молодих науковців.
ORCID: orcid.org/0000-0001-7496-4353
orcid.org/0000-0002-9148-1561
orcid.org/0000-0002-7251-994X
orcid.org/0000-0003-1027-5262
orcid.org/0000-0002-0725-392X
DOI: doi.org/10.20998/2522-9052.2021.1.09
URI: http://repository.kpi.kharkov.ua/handle/KhPI-Press/52495
Appears in Collections:Кафедра "Обчислювальна техніка та програмування"

Files in This Item:
File Description SizeFormat 
AIS_2021_5_1_Barkovska_International.pdf660,28 kBAdobe PDFThumbnail
View/Open
Show full item record  Google Scholar



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.