Інформаційні технології інтеграції даних про клієнтів та споживачів

dc.contributor.authorБабіч, Ігор Костянтинович
dc.contributor.authorОрловський, Дмитро Леонідович
dc.contributor.authorКопп, Андрій Михайлович
dc.date.accessioned2026-01-06T13:33:56Z
dc.date.issued2025
dc.description.abstractНа прикладі книжкового підприємства, що поєднує функції видавця, дистриб’ютора та ритейлера, показано, як багатоканальна операційна діяльність призводить до накопичення у базах даних величезних масивів інформації, яка є фрагментованою, неповною, неструктурованою та містить дублікати. Такий стан унеможливлює ефективний аналіз клієнтської поведінки, зокрема точний розрахунок ключових показників ефективності. Актуальність роботи полягає у зменшенні цього критичного розриву між обсягом накопиченої інформації та здатністю бізнесу приймати на її основі ефективні управлінські рішення. Метою даної роботи є розробка методологічного підходу до створення сховища даних за архітектурою «зірка» та реалізація адаптивного ETL-ланцюга із вбудованими правилами контролю якості. Проведено аналіз сучасних методів проєктування сховищ даних, включно з переходом від моделі «сутність-відношення» до схеми «зірка». На основі структури транзакційної бази даних та бізнес-вимог до аналізу даних спроєктовано аналітичне сховище за схемою «зірка», визначено ключові факти і виміри, необхідні для підтримки всебічної клієнтської аналітики. Для перенесення даних з оперативної системи до сховища розроблено процес вилучення, перетворення та завантаження даних, описано його логіку: вибірку даних із джерел, їх очищення та трансформацію у проміжній зоні, а також завантаження у цільові таблиці сховища. Ефективність розроблених процесів оцінено на основі даних журналу реєстрації подій. Результати аналізу підтверджують надійність та високу продуктивність запропонованого рішення. Запропонований у статті підхід забезпечує автоматизоване, надійне й ефективне оновлення сховища даних, створюючи єдине джерело достовірних даних для бізнес-аналітики. Using the example of a book enterprise that combines the functions of a publisher, distributor, and retailer, it is shown how multi-channel operational activities lead to the accumulation of vast arrays of information in databases that are fragmented, incomplete, unstructured, and contain duplicates. This situation makes it impossible to effectively analyze customer behavior, including the accurate calculation of key performance indicators. The relevance of the work lies in reducing this critical gap between the volume of accumulated information and the business's ability to make effective management decisions based on it. The purpose of this work is to develop a methodological approach to creating a data warehouse based on the star schema architecture and to implement an adaptive ETL chain with built-in quality control rules. An analysis of modern data warehouse design methods was conducted, including the transition from the entity-relationship model to the star schema. Based on the structure of the transactional database and business requirements for data analysis, an analytical warehouse using the star schema was designed, and key facts and dimensions necessary to support comprehensive customer analytics were identified. To transfer data from the transactional system to the warehouse, an extract, transform, and load (ETL) process was developed, and its logic was described: data extraction from sources, its cleaning and transformation in a staging area, and loading into the target warehouse tables. The effectiveness of the developed processes was evaluated based on event log data. The analysis results confirm the reliability and high performance of the proposed solution. The approach proposed in the article provides automated, reliable, and efficient updating of the data warehouse, creating a single source of truth for business analytics.
dc.identifier.citationБабіч І. К. Інформаційні технології інтеграції даних про клієнтів та споживачів / І. К. Бабіч, Д. Л. Орловський, А. М. Копп // Вісник Національного технічного університету "ХПІ". Серія: Системний аналіз, управління та інформаційні технології = Bulletin of the National Technical University "KhPI". Series: System analysis, control and information technology : зб. наук. пр. – Харків : НТУ "ХПІ", 2025. – № 2 (14). – С. 69-78.
dc.identifier.doihttps://doi.org/10.20998/2079-0023.2025.02.09
dc.identifier.orcidhttps://orcid.org/0009-0003-0433-4913
dc.identifier.orcidhttps://orcid.org/0000-0002-8261-2988
dc.identifier.orcidhttps://orcid.org/0000-0002-3189-5623
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/97204
dc.language.isouk
dc.publisherНаціональний технічний університет "Харківський політехнічний інститут"
dc.subjectбаза даних
dc.subjectсховище даних
dc.subjectінтеграція даних
dc.subjectсхема "зірка"
dc.subjectтаблиці вимірів/фактів
dc.subjectETL
dc.subjectdatabase
dc.subjectdata warehouse
dc.subjectdata integration
dc.subjectstar schema
dc.subjectdimension/fact tables
dc.subjectETL
dc.titleІнформаційні технології інтеграції даних про клієнтів та споживачів
dc.title.alternativeInformation technologies for the integration of customer and consumer data
dc.typeArticle

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
visnyk_KhPI_2025_2_SAUIT_Babich_Informatsiini_tekhnolohii.pdf
Розмір:
812.61 KB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
license.txt
Розмір:
11.15 KB
Формат:
Item-specific license agreed upon to submission
Опис: