Comparative analysis of modified semi-supervised learning algorithms on a small amount of labeled data

dc.contributor.authorLyubchyk, Leonid Mykhailovych
dc.contributor.authorYamkovyi, Klym Serhiyovych
dc.date.accessioned2026-04-26T19:07:28Z
dc.date.issued2022
dc.description.abstractThe paper is devoted to improving semi-supervised clustering methods and comparing their accuracy and robustness. The proposed approach is based on expanding a clustering algorithm for using an available set of labels by replacing the distance function. Using the distance function considers not only spatial data but also available labels. Moreover, the proposed distance function could be adopted for working with ordinal variables as labels. An extended approach is also considered, based on a combination of unsupervised k-medoids methods, modified for using only labeled data during the medoids calculation step, supervised method of k nearest neighbor, and unsupervised k-means. The learning algorithm uses information about the nearest points and classes’ centers of mass. The results demonstrate that even a small amount of labeled data allows us to use semi-supervised learning, and proposed modifications improve accuracy and algorithm performance, which was found during experiments.
dc.description.abstractПрисвячено вдосконаленню методів кластеризації з частковим підкріпленням, а також порівнянню їх точності та стійкості. Запропонований підхід заснований на розширенні алгоритмів кластеризації шляхом використання доступного набору міток класів за допомогою заміни функції відстані, при цьому за використання запропонованої функції відстані враховуються не тільки просторові дані, але й мітки. Більше того, запропонована функція відстані може бути адаптована для роботи з порядковими змінними як мітки. Також запропоновано підхід, заснований на методі навчання без вчителя k-медоїдів, модифікований для використання лише розмічених даних на етапі обчислення медоїдів кластерів, комбінацію методу навчання з учителем k найближчих сусідів та без вчителя – k-середніх. При цьому алгоритм навчання використовує інформацію як про найближчі точки, так і про центри мас класів. Отримані результати демонструють, що навіть невеликий обсяг помічених даних дає змогу використовувати навчання з частковим підкріпленням, а запропоновані модифікації забезпечують підвищення точності і стійкості алгоритму, що продемонстровано під час експериментів.
dc.identifier.citationLyubchyk L., Yamkovyi K. Comparative analysis of modified semi- supervised learning algorithms on a small amount of labeled data. System Research and Information Technologies. 2022. No. 4. P. 34–43. https://doi.org/10.20535/SRIT.2308-8893.2022.4.03.
dc.identifier.doihttps://doi.org/10.20535/SRIT.2308-8893.2022.4.03
dc.identifier.orcidhttps://orcid.org/0000-0003-0237-8915
dc.identifier.orcidhttps://orcid.org/0000-0001-9512-4150
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/101511
dc.language.isoen
dc.publisherTechnical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
dc.subjectcenter of mass
dc.subjectclustering
dc.subjectdistance function
dc.subjectmedoids
dc.subjectnearest neighbor
dc.subjectsemi-supervised learning
dc.subjectцентр мас
dc.subjectкластеризація
dc.subjectфункція відстані
dc.subjectнайближчий сусід
dc.subjectнавчання з частковим залученням вчителя
dc.subjectмедоід
dc.titleComparative analysis of modified semi-supervised learning algorithms on a small amount of labeled data
dc.title.alternativeПорівняльний аналіз модифікованих алгоритмів навчання з частковим залученням учителя на малій кількості розмічених даних
dc.typeArticle

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
SRIT_2022_4_Lyubchyk_Comparative_analysis.pdf
Розмір:
497.93 KB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
license.txt
Розмір:
11.15 KB
Формат:
Item-specific license agreed upon to submission
Опис: