Трирівнева система верифікації графічного контенту наукових публікацій на основі топологічного аналізу даних
Вантажиться...
Дата
Науковий ступінь
Рівень дисертації
Шифр та назва спеціальності
Рада захисту
Установа захисту
Науковий керівник/консультант
Члени комітету
Назва журналу
Номер ISSN
Назва тому
Видавець
Національний університет “Полтавська політехніка імені Юрія Кондратюка”
Анотація
Об'єкт дослідження ‒ процес верифікації графічного контенту наукових публікацій. Предмет дослідження ‒ методи та алгоритми виявлення плагіату графічної інформації на основі аналізу змісту даних. Метою роботи є розробка та обґрунтування трирівневої системи верифікації графічного контенту наукових публікацій. Результати дослідження. У статті запропоновано новий комплексний метод виявлення плагіату графічної інформації у наукових публікаціях. На відміну від існуючих систем (Proofig, Imagetwin), що виявляють лише візуальні дублікати, запропонований підхід аналізує зміст даних графіків. Метод базується на поєднанні трьох рівнів аналізу: реверс-інжиніринг числових даних з графічних зображень, геометричний аналіз форми кривих за допомогою алгоритму динамічного зсуву часу (DTW) та топологічний аналіз даних (TDA) з використанням персистентних гомологій і відстані Вассерштейна. Наукова новизна полягає у застосуванні топологічних інваріантів для порівняння змісту графічних даних, що забезпечує стійкість до візуальних маніпуляцій: зміни масштабу осей, кольорової схеми, стилю ліній та мови підписів. Розроблено інтегральну метрику оцінки подібності графіків. Ефективність підходу підтверджено на прикладі виявлення замаскованого плагіату.
Object of research is the process of verifying graphical content in scientific publications. Subject of research is methods and algorithms for detecting plagiarism of graphical information based on data content analysis. The aim of the work is to develop and substantiate a three-level system for verifying graphical content in scientific publications. Research results. The paper proposes a novel comprehensive method for detecting plagiarism of graphical information in scientific publications. Unlike existing systems (Proofig, Imagetwin) that detect only visual duplicates, the proposed approach analyzes the content of graph data. The method is based on a combination of three levels of analysis: reverse engineering of numerical data from graphical images, geometric analysis of curve shapes using the Dynamic Time Warping (DTW) algorithm, and Topological Data Analysis (TDA) using persistent homology and Wasserstein distance. The scientific novelty lies in the application of topological invariants for comparing the content of graphical data, which ensures robustness against visual manipulations: changes in axis scale, color scheme, line style, and label language. An integrated metric for assessing graph similarity has been developed. The effectiveness of the approach is confirmed by an example of detecting masked plagiarism.
Object of research is the process of verifying graphical content in scientific publications. Subject of research is methods and algorithms for detecting plagiarism of graphical information based on data content analysis. The aim of the work is to develop and substantiate a three-level system for verifying graphical content in scientific publications. Research results. The paper proposes a novel comprehensive method for detecting plagiarism of graphical information in scientific publications. Unlike existing systems (Proofig, Imagetwin) that detect only visual duplicates, the proposed approach analyzes the content of graph data. The method is based on a combination of three levels of analysis: reverse engineering of numerical data from graphical images, geometric analysis of curve shapes using the Dynamic Time Warping (DTW) algorithm, and Topological Data Analysis (TDA) using persistent homology and Wasserstein distance. The scientific novelty lies in the application of topological invariants for comparing the content of graphical data, which ensures robustness against visual manipulations: changes in axis scale, color scheme, line style, and label language. An integrated metric for assessing graph similarity has been developed. The effectiveness of the approach is confirmed by an example of detecting masked plagiarism.
Опис
Ключові слова
плагіат графіків, топологічний аналіз даних, персистентні гомології, динамічний зсув часу, наукова доброчесність, graph plagiarism, topological data analysis, persistent homology, dynamic time warping, research integrity
Бібліографічний опис
Главчев М. І., Главчева Ю. М., Ліпчанський М. В., Баленко О. І. Трирівнева система верифікації графічного контенту наукових публікацій на основі топологічного аналізу даних. Системи управління, навігації та зв'язку : зб. наук. пр. / гол. ред. В. В. Косенко ; Полт. нац. техн. ун-т ім. Юрія Кондратюка. Полтава : ПНТУ, 2026. Вип. 1 (83). С. 51-57. https://doi.org/10.26906/SUNZ.2026.1.051
