The approach and the software tool to calculate semantic quality measures of business process models

Вантажиться...
Ескіз

Дата

2022

DOI

doi.org/10.20998/2079-0023.2022.01.11

Науковий ступінь

Рівень дисертації

Шифр та назва спеціальності

Рада захисту

Установа захисту

Науковий керівник

Члени комітету

Видавець

Національний технічний університет "Харківський політехнічний інститут"

Анотація

Business process models are essential business process management artifacts that help describe visually ongoing business activities to facilitate communication between information technology and business stakeholders. Business process models are used to find inefficient spots within described workflows and resolve detected shortcomings by automation via configurable software solutions or unified workflow engines. However, this is impossible when using syntactically or semantically poor business process models. It is the same as building a house using the blueprint with windows on the floor and typos in text labels. Therefore, it is extremely important to keep created business process models clear and relevant to the actual workflows they describe. Hence, in this paper, we propose the approach and the software tool to calculate semantic quality measures of business process models. The proposed approach uses a special procedure to extract the modeling domain statements using natural language processing techniques. According to the proposed approach, the initial textual descriptions of business process models should be tokenized. Then obtained tokens should be turned to the lower case style and cleansed to remove non-alphabetic tokens and stop words. Finally, the remaining tokens should be stemmed and the existing duplicates should be removed. The same procedure is then repeated for text labels attached to the business process model activities. Then, tokens present in the result of textual description’s processing but missing in the result of labels’ processing are considered incomplete (i.e. incorrect in the modeling domain). Similarly, tokens present in the result of labels’ processing but missing in the result of textual description’s processing are considered invalid (i.e. irrelevant to the modeling domain). Therefore, respective semantic quality measures can be calculated. The software tool is created using the Python programming language because of its powerful natural language processing packages.
Моделі бізнес-процесів є важливими артефактами управління бізнес-процесами, які допомагають візуально описати поточну бізнесдіяльність, щоб полегшити взаємодію зацікавлених сторін бізнесу з інформаційними технологіями. Моделі бізнес-процесів використовуються для пошуку неефективних місць в описаних робочих процесах та усунення виявлених недоліків шляхом автоматизації за допомогою програмних рішень, що налаштовуються, або уніфікованих середовищ виконання робочих процесів. Однак це неможливо при використанні синтаксично або семантично некоректних моделей бізнес-процесів. Це те саме, що будувати будинок за кресленням із вікнами на підлозі та помилками в текстових написах. Тому надзвичайно важливо зберігати створені моделі бізнес-процесів чіткими та відповідними фактичним робочим процесам, які вони описують. Тому в цій роботі ми пропонуємо підхід та програмний інструмент для розрахунку семантичних показників якості моделей бізнес-процесів. Запропонований підхід використовує спеціальну процедуру для вилучення тверджень про предметну область з використанням методів обробки природної мови. Відповідно до запропонованого підходу початкові текстові описи моделей бізнес-процесів мають бути токенізованими. Потім отримані токени слід подати у нижньому регістрі та очистити, щоб видалити неалфавітні токени та стоп-слова. Нарешті, решту токенів слід стематизувати, а наявні дублікати слід видалити. Потім ця ж процедура повторюється для текстових міток, доданих до робіт моделі бізнес-процесу. Тоді лексеми, присутні в результаті обробки текстового опису, але відсутні в результаті обробки текстових міток, вважаються неповними (тобто неправильними щодо предметної області моделювання). Аналогічно, лексеми, присутні в результаті обробки текстових міток, але відсутні в результаті обробки текстового опису, вважаються недійсними (тобто не мають відношення до предметної області моделювання). Таким чином, можна розрахувати відповідні показники семантичної якості. Програмний засіб був створений за допомогою мови програмування Python завдяки її потужним пакетам обробки природної мови.

Опис

Ключові слова

business process modeling, semantic quality, quality measure, natural language processing, software tool, моделювання бізнес-процесів, семантична якість, обробка природної мови, програмний засіб

Бібліографічний опис

Kopp A. M. The approach and the software tool to calculate semantic quality measures of business process models / A. M. Kopp, D. L. Orlovskyi // Вісник Національного технічного університету "ХПІ". Сер. : Системний аналіз, управління та інформаційні технології = Bulletin of the National Technical University "KhPI". Ser. : System analysis, control and information technology : зб. наук. пр. – Харків : НТУ "ХПІ", 2022. – № 1 (7). – С. 66-69.