International system of knowledge exchange for young scientists

dc.contributor.authorBarkovska, Olesiaen
dc.contributor.authorKholiev, Vladyslaven
dc.contributor.authorPyvovarova, Dariaen
dc.contributor.authorIvaschenko, Georgiyen
dc.contributor.authorRosinskiy, Dmytroen
dc.date.accessioned2021-05-05T10:06:26Z
dc.date.available2021-05-05T10:06:26Z
dc.date.issued2021
dc.description.abstractThe paper proposes a system which is electronic data storage (of qualification works of students from different countries) and provides the capability to identify and connect young scientists conducting research on a related problem area. The purpose of developing this system is to provide opportunities for knowledge exchange, research in a team on a common problem, as well as to identify scientific trends in different countries. In this paper, the preprocessing methods influence on the work of classifiers such as Logistic Regression, LSTM, BERT, LightGBM was researched. A study was conducted on the speed of classification and F1 assessment. Conclusions. Lemmatization showed to require a shorter oper ating time compared to steaming by almost twice and a better score by an average of 5 percent, so it was decided to use the Logistic Regression classifier with lemmatization at the stage of text preparation in the subsequent operation of the proposed ISKE.en
dc.description.abstractУ роботі запропонована система, яка являє електронне сховище даних (кваліфікаційних робіт студентів із різних країн) та забезпечує можливість виявити та зв’язати між собою молодих вчених, що ведуть дослідження над єдиною проблемною областю. Метою розробки даної системи є забезпечення можливості обміну знаннями, виконання досліджень у команді над спільною проблемою, а також визначення наукових тенденцій у різних країнах світу. У роботі досліджено вплив методів препроцесінгу на роботу таких класифікаторів, як Logistic Regression, LSTM, BERT, LightGBM. Проведено дослідження щодо швидкості класифікації та F1 оцінки. Висновки. Лематизація показала коротший час роботи у порівнянні зі стемінгом майже в два рази та кращу оцінку в середньому на 5 відсотків, тому було прийнято рішення використовувати класифікатор Logistic Regression із лематизацією на етапі підготовки тексту у подальшій роботі запропонованої системи обміну знаннями молодих науковців.uk
dc.identifier.citationInternational system of knowledge exchange for young scientists / O. Barkovska [et al.] // Сучасні інформаційні системи = Advanced Information Systems. – 2021. – Т. 5, № 1. – С. 69-74.en
dc.identifier.doidoi.org/10.20998/2522-9052.2021.1.09
dc.identifier.orcidhttps://orcid.org/0000-0001-7496-4353
dc.identifier.orcidhttps://orcid.org/0000-0002-9148-1561
dc.identifier.orcidhttps://orcid.org/0000-0002-7251-994X
dc.identifier.orcidhttps://orcid.org/0000-0003-1027-5262
dc.identifier.orcidhttps://orcid.org/0000-0002-0725-392X
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/52495
dc.language.isoen
dc.publisherНаціональний технічний університет "Харківський політехнічний інститут"uk
dc.subjectclassificationen
dc.subjectpreprocessingen
dc.subjectlemmatizationen
dc.subjectstemmingen
dc.subjectкласифікаціяuk
dc.subjectпопередня обробкаuk
dc.subjectлематизаціяuk
dc.subjectстемінгuk
dc.titleInternational system of knowledge exchange for young scientistsen
dc.title.alternativeСистема обміну знаннями молодих науковців із різних країнuk
dc.typeArticleen

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Ескіз
Назва:
AIS_2021_5_1_Barkovska_International.pdf
Розмір:
660.28 KB
Формат:
Adobe Portable Document Format
Опис:

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
11.25 KB
Формат:
Item-specific license agreed upon to submission
Опис: