Порівняння методів прогнозування концентрацій PM₁₀ в Кривому Розі в зимовий період

Вантажиться...
Ескіз

Дата

Науковий ступінь

Рівень дисертації

Шифр та назва спеціальності

Рада захисту

Установа захисту

Науковий керівник/консультант

Члени комітету

Назва журналу

Номер ISSN

Назва тому

Видавець

Національний технічний університет "Харківський політехнічний інститут"

Анотація

У статті порівнюються два підходи для прогнозування концентрації дрібнодисперсних частинок PM₁₀ - класичне статистичне моделювання (множинна лінійна регресі, МЛР) та сучасний алгоритм машинного навчання Random Forest (RF). Об’єктом дослідження обрано одне з найбільших промислових міст України - Кривий Ріг, яке відоме своєю складною екологічною ситуацією. Розглянуто зимовий період 2024-2025 рр., протягом якого виконано безперервний моніторинг PM₁₀ та метеорологічних показників за допомогою автоматизованої міні-станції Cairnet із сертифікованими датчиками. Проведено попередню обробку даних (очищення від аномалій, заповнення пропусків, нормалізація) та формування ознак, зокрема введено категоріальні змінні для частини доби, типу дня (вихідний/робочий) та інтенсивності викидів. Обидві моделі показали схожі добові та тижневі цикли концентрації PM₁₀: пікові значення спостерігаються у вечірній і нічний час, найнижчі - вдень, що узгоджується з очікуваннями та літературними даними. Водночас точність прогнозу суттєво різниться: Random Forest забезпечив значно вищу детермінацію (R²≈0,72 проти R²≈0,27 у регресії) і вдвічі меншу середню абсолютну похибку. Наведено порівняння важливості факторів для обох моделей: Random Forest виділив атмосферний тиск, температуру та вологість як ключові чинники, тоді як лінійна регресія приписує найбільшу вагу впровадженим штучним змінним (індикаторам часу доби та інтенсивності викидів). Проаналізовано причини цих розбіжностей з огляду на нелінійні взаємодії та мультиколінеарність. Зроблено висновок, що для високоточного оперативного прогнозування рівня PM₁₀ доцільно застосовувати Random Forest, тоді як проста лінійна модель може використовуватися для швидких попередніх оцінок та інтерпретації впливу окремих факторів. The paper compares two approaches to forecasting PM₁₀ particulate matter concentrations - a classical statistical model (multiple linear regression) and a modern machine learning algorithm (Random Forest). The study object is Kryvyi Rih, one of the largest industrial cities in Ukraine known for its challenging environmental situation. The winter period of 2024-2025 was considered, during which continuous monitoring of PM₁₀ and meteorological parameters was carried out using an automated Cairnet mini-station with certified sensors. Data preprocessing was performed (outlier noise removal, gap filling, normalization) and feature engineering applied, including categorical variables for time of day, day type (weekend/weekday) and emissions intensity level. Both models revealed similar daily and weekly cycles in PM₁₀ concentration: peak values occurred in the evening and night, lowest - during daytime, consistent with expectations and literature. However, the forecast accuracy differed significantly: Random Forest achieved much higher determination (R²≈0.72 vs R²≈0.27 for regression) and halved mean absolute error. A comparison of factor importance for both models is presented: Random Forest identified atmospheric pressure, temperature and humidity as key drivers, whereas the linear regression assigns greatest weight to introduced artificial variables (time-of-day and emissions intensity indicators). The reasons for these discrepancies are analyzed in view of nonlinear interactions and multicollinearity. It is concluded that for high-precision real-time PM₁₀ forecasting, Random Forest is advisable, while a simple linear model can be used for quick preliminary assessments and interpretation of individual factor effects.

Опис

Ключові слова

прогнозування, дрібнодисперсні частки, PM₁₀, лінійна регресія, Random Forest, важливість змінних, якість повітря, forecasting, particulate matter, PM₁₀, linear regression, Random Forest, feature importance, air quality

Бібліографічний опис

Порівняння методів прогнозування концентрацій PM₁₀ в Кривому Розі в зимовий період / Є. О. Лебьодкін [та ін.] // Вісник Національного технічного університету "ХПІ". Серія: Хімія, хімічна технологія та екологія = Bulletin of the National Technical University "KhPI". Series: Chemistry, Chemical Technology and Ecology : зб. наук. пр. – Харків : НТУ "ХПІ", 2025. – № 2 (14). – С. 83-91.

Підтвердження

Рецензія

Додано до

Згадується в