Бойко, Антон МиколайовичМарусенко, Олексій МиколайовичМєтєльов, Володимир ОлександровичОвсяніков, Владислав Валерійович2025-01-092024Дослідження та прогнозування часових рядів із застосуванням технологій паралельних обчислень / А. М. Бойко, О. М. Марусенко, В. О. Мєтєльов, В. В. Овсяніков // Вісник Національного технічного університету "ХПІ". Сер. : Нові рішення у сучасних технологіях = Bulletin of the National Technical University "KhPI". Ser. : New solutions in modern technology : зб. наук. пр. – Харків : НТУ "ХПІ", 2024. – № 4 (22). – С. 29-37.https://repository.kpi.kharkov.ua/handle/KhPI-Press/85083Розглядається проблема ефективної обробки часових рядів з метою прогнозування, використовуючи технології розподілених обчислень у хмарному середовищі. Акцентовано увагу на адаптації сучасних підходів до аналізу часових рядів для роботи з великими обсягами даних та їх інтеграції з інфраструктурою хмарних обчислень. Особливий акцент зроблено на обробці ультра-довгих часових рядів, які відзначаються низьким сигнал-шум співвідношенням, складною структурою та довготривалими трендами. Проаналізовано широкий спектр методів прогнозування, включаючи класичні статистичні моделі, такі як авторегресійні інтегровані моделі з рухомим середнім, та сучасні підходи машинного навчання, зокрема нейронні мережі з довгою короткотривалою пам'яттю. Продемонстровано переваги використання паралельних обчислень у забезпеченні значного прискорення обробки великих обсягів даних. Зокрема, у роботі підтверджено ефективність запропонованого підходу з використанням хмарної інфраструктури Amazon Web Services, що дозволяє оптимізувати ресурси та підвищити точність прогнозування. Розроблено програмний пакет на основі технологій Apache Spark для аналізу часових рядів у розподілених середовищах. Отримані результати формують основу для майбутніх досліджень у напрямі створення комплексних систем аналізу часових рядів, що враховують специфіку різних галузей.This study addresses the challenge of efficient time series processing for forecasting purposes using distributed computing technologies in a cloud environment. The focus is placed on adapting modern approaches to time series analysis for handling large data volumes and integrating them with cloud computing infrastructure. Particular attention is given to processing ultra-long time series, characterized by low signal-to-noise ratios, complex structures, and long-term trends. The study outlines prospects for further software enhancements, such as integrating adaptive algorithms and expanding their application to fields like cybersecurity, financial analytics, infrastructure monitoring, and forecasting in economics and industry. The results of extensive computational experiments confirm the effectiveness of the developed algorithms in improving forecast accuracy and reducing data processing time. A software package based on Apache Spark technologies was developed for time series analysis in distributed environments. These findings lay the foundation for future research aimed at creating comprehensive time series analysis systems that account for the specific needs of various industries.ukчасові рядипаралельні обчисленняхмарні технологіїкластерипрограмне забезпеченняtime seriesparallel computingcloud technologiesclusterssoftwareДослідження та прогнозування часових рядів із застосуванням технологій паралельних обчисленьResearch and forecasting of time series using parallel computing technologiesArticlehttps://doi.org/10.20998/2413-4295.2024.04.04https://orcid.org/0000-0001-6911-2500https://orcid.org/0000-0002-2633-6296