Публікація:
An algorithm for NLP-based similarity measurement of activity labels in a database of business process models

dc.contributor.authorKopp, Andrii Mykhailovych
dc.contributor.authorOrlovskyi, Dmytro Leonidovych
dc.date.accessioned2023-07-19T13:21:12Z
dc.date.available2023-07-19T13:21:12Z
dc.date.issued2023
dc.description.abstractBusiness process modeling is an important part of organizational management since it enables companies to obtain insights into their operational workflows and find opportunities for development. However, evaluating and quantifying the similarity of multiple business process models can be difficult because these models frequently differ greatly in terms of structure and nomenclature. This study offers an approach that uses natural language processing techniques to evaluate the similarity of business process models in order to address this issue. The algorithm uses the activity labels given in the business process models as input to produce textual descriptions of the associated business processes. The algorithm includes various preprocessing stages to guarantee that the textual descriptions are correct and consistent. First, single words are retrieved and transformed to lower case from the resulting textual descriptions. After that, all non-alphabetic and stop words are removed from the retrieved words. The remaining words are then stemmed, which includes reducing them to their base form. The algorithm evaluates the similarity of distinct business process models using similarity measures, including Jaccard, Sorensen – Dice, overlap, and simple matching coefficients, after the textual descriptions have been prepared and preprocessed. These metrics provide a more detailed understanding of the similarities and differences across various business process models, which can then be used to influence decision-making and business process improvement initiatives. The software implementation of the proposed algorithm demonstrates its usage for similarity measurement in a database of business process models. Experiments show that the developed algorithm is 31% faster than a search based on the SQL LIKE clause and allows finding 18% more similar models in the business process model database.
dc.description.abstractМоделювання бізнес-процесів є важливою частиною організаційного управління, оскільки дозволяє компаніям отримати уявлення про свої операційні бізнес-процеси та знайти можливості для розвитку. Однак оцінити та кількісно виміряти схожість декількох моделей бізнес-процесів може бути складно, оскільки ці моделі часто сильно відрізняються за структурою та номенклатурою. Це дослідження пропонує підхід, який використовує методи обробки природної мови для оцінки схожості моделей бізнес-процесів, для розв’язку цієї задачі. Алгоритм використовує мітки діяльностей, наведені в моделях бізнес-процесів, як вхідні дані для створення текстових описів пов’язаних бізнес-процесів. Алгоритм включає декілька етапів попередньої обробки, щоб гарантувати, що текстові описи є коректними і послідовними. Спочатку з отриманих текстових описів вилучаються окремі слова і представляються у нижньому регістрі. Після цього з отриманих слів видаляються всі нелітерні та стоп-слова. Потім слова, що залишилися, піддаються стемінгу, тобто приведенню до їхньої базової форми. Після підготовки та попередньої обробки текстових описів алгоритм оцінює схожість різних моделей бізнес-процесів за допомогою мір схожості, включаючи коефіцієнти Жаккара, Соренсена – Дайса, перетину та простого коефіцієнту відповідності. Ці метрики забезпечують більш детальне розуміння подібності і відмінності між різними моделями бізнес-процесів, які потім можуть бути використані для впливу на прийняття рішень та ініціатив щодо вдосконалення бізнес-процесів. Програмна реалізація запропонованого алгоритму демонструє його використання для вимірювання подібності в базі даних моделей бізнес-процесів. Експерименти демонструють, що розроблений алгоритм є на 31 % швидшим за пошук на основі виразу SQL LIKE, а також дозволяє знайти на 18 % більше подібних моделей у базі даних моделей бізнес-процесів.
dc.identifier.citationKopp A. M. An algorithm for NLP-based similarity measurement of activity labels in a database of business process models / A. M. Kopp, D. L. Orlovskyi // Вісник Національного технічного університету "ХПІ". Сер. : Системний аналіз, управління та інформаційні технології = Bulletin of the National Technical University "KhPI". Ser. : System analysis, control and information technology : зб. наук. пр. – Харків : НТУ "ХПІ", 2023. – № 1 (9). – С. 54-59.
dc.identifier.doihttps://doi.org/10.20998/2079-0023.2023.01.08
dc.identifier.orcidhttps://orcid.org/0000-0002-3189-5623
dc.identifier.orcidhttps://orcid.org/0000-0002-8261-2988
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/67267
dc.language.isoen
dc.publisherНаціональний технічний університет "Харківський політехнічний інститут"
dc.subjectbusiness process model
dc.subjectdatabase of business process models
dc.subjectnatural language processing
dc.subjectsimilarity measurement algorithm
dc.subjectactivity labels
dc.subjectsoftware implementation of the algorithm
dc.subjectмодель бізнес-процесу
dc.subjectбаза даних моделей бізнес-процесів
dc.subjectобробка природної мови
dc.subjectалгоритм вимірювання подібності
dc.subjectмітки діяльностей
dc.subjectпрограмна реалізація алгоритму
dc.titleAn algorithm for NLP-based similarity measurement of activity labels in a database of business process models
dc.title.alternativeАлгоритм вимірювання подібності міток діяльностей на основі NLP у базі даних моделей бізнес-процесів
dc.typeArticle
dspace.entity.typePublication
relation.isAuthorOfPublicationc4f9f61b-9d99-4d19-a1bf-039895e74ab6
relation.isAuthorOfPublication.latestForDiscoveryc4f9f61b-9d99-4d19-a1bf-039895e74ab6

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Ескіз
Назва:
visnyk_KhPI_2023_1_SAUIT_Kopp_An_algorithm.pdf
Розмір:
695.38 KB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
11.18 KB
Формат:
Item-specific license agreed upon to submission
Опис: