Інформаційні технології інтеграції даних про клієнтів та споживачів
Вантажиться...
Дата
Науковий ступінь
Рівень дисертації
Шифр та назва спеціальності
Рада захисту
Установа захисту
Науковий керівник/консультант
Члени комітету
Назва журналу
Номер ISSN
Назва тому
Видавець
Національний технічний університет "Харківський політехнічний інститут"
Анотація
На прикладі книжкового підприємства, що поєднує функції видавця, дистриб’ютора та ритейлера, показано, як багатоканальна операційна діяльність призводить до накопичення у базах даних величезних масивів інформації, яка є фрагментованою, неповною, неструктурованою та містить дублікати. Такий стан унеможливлює ефективний аналіз клієнтської поведінки, зокрема точний розрахунок ключових показників ефективності. Актуальність роботи полягає у зменшенні цього критичного розриву між обсягом накопиченої інформації та здатністю бізнесу приймати на її основі ефективні управлінські рішення. Метою даної роботи є розробка методологічного підходу до створення сховища даних за архітектурою «зірка» та реалізація адаптивного ETL-ланцюга із вбудованими правилами контролю якості. Проведено аналіз сучасних методів проєктування сховищ даних, включно з переходом від моделі «сутність-відношення» до схеми «зірка». На основі структури транзакційної бази даних та бізнес-вимог до аналізу даних спроєктовано аналітичне сховище за схемою «зірка», визначено ключові факти і виміри, необхідні для підтримки всебічної клієнтської аналітики. Для перенесення даних з оперативної системи до сховища розроблено процес вилучення, перетворення та завантаження даних, описано його логіку: вибірку даних із джерел, їх очищення та трансформацію у проміжній зоні, а також завантаження у цільові таблиці сховища. Ефективність розроблених процесів оцінено на основі даних журналу реєстрації подій. Результати аналізу підтверджують надійність та високу продуктивність запропонованого рішення. Запропонований у статті підхід забезпечує автоматизоване, надійне й ефективне оновлення сховища даних, створюючи єдине джерело достовірних даних для бізнес-аналітики.
Using the example of a book enterprise that combines the functions of a publisher, distributor, and retailer, it is shown how multi-channel operational activities lead to the accumulation of vast arrays of information in databases that are fragmented, incomplete, unstructured, and contain duplicates. This situation makes it impossible to effectively analyze customer behavior, including the accurate calculation of key performance indicators. The relevance of the work lies in reducing this critical gap between the volume of accumulated information and the business's ability to make effective management decisions based on it. The purpose of this work is to develop a methodological approach to creating a data warehouse based on the star schema architecture and to implement an adaptive ETL chain with built-in quality control rules. An analysis of modern data warehouse design methods was conducted, including the transition from the entity-relationship model to the star schema. Based on the structure of the transactional database and business requirements for data analysis, an analytical warehouse using the star schema was designed, and key facts and dimensions necessary to support comprehensive customer analytics were identified. To transfer data from the transactional system to the warehouse, an extract, transform, and load (ETL) process was developed, and its logic was described: data extraction from sources, its cleaning and transformation in a staging area, and loading into the target warehouse tables. The effectiveness of the developed processes was evaluated based on event log data. The analysis results confirm the reliability and high performance of the proposed solution. The approach proposed in the article provides automated, reliable, and efficient updating of the data warehouse, creating a single source of truth for business analytics.
Опис
Ключові слова
база даних, сховище даних, інтеграція даних, схема "зірка", таблиці вимірів/фактів, ETL, database, data warehouse, data integration, star schema, dimension/fact tables, ETL
Бібліографічний опис
Бабіч І. К. Інформаційні технології інтеграції даних про клієнтів та споживачів / І. К. Бабіч, Д. Л. Орловський, А. М. Копп // Вісник Національного технічного університету "ХПІ". Серія: Системний аналіз, управління та інформаційні технології = Bulletin of the National Technical University "KhPI". Series: System analysis, control and information technology : зб. наук. пр. – Харків : НТУ "ХПІ", 2025. – № 2 (14). – С. 69-78.
