Моделі машинного навчання для передбачення кількості захворілих на COVID-19 в Україні та Індії

dc.contributor.authorХорошун, Ганна Миколаївна
dc.contributor.authorРязанцев, Олександр Іванович
dc.contributor.authorКоверга, Марк Олександрович
dc.contributor.authorПокришка, Сергiй Анатолiйович
dc.date.accessioned2023-09-08T16:01:20Z
dc.date.available2023-09-08T16:01:20Z
dc.date.issued2022
dc.description.abstractПобудовані моделі передбачення кількості захворілих на COVID-19 з використанням методів машинного навчання. Побудовані моделі навчались на даних зібраних з різних офіційних джерел, включаючи Всесвітню Організацію Здоров'я, з початку епідемії до теперішнього часу. Для навчання моделей передбачення кількості захворілих на COVID-19 обрано Україну та Індію. Методами, що надали високу точність прогнозу для існуючих даних, виявились алгоритми лінійної регресії для України та градієнтного бустингу для Індії. Аналіз даних проводився за допомогою мови програмування Python, з використанням бібліотеки Sklearn, яка побудована на основі SciPy (Scientific Python). Крім того, використовувалась бібліотека алгоритму градієнтного бустингу XGboost. Для розробки моделі обрано багатофакторне прогнозування часових рядів з використанням у якості предикаторів запізнення часового ряду. Визначено характеристики, що враховуються при навчанні моделі, а саме: дата початку події, день тижня, номер тижня, місяць та інші. Проведено аналіз щодо визначення впливу цих параметрів на якість навчання моделі. Оцінені похибки моделей та точність прогнозу з найкращими показниками 0.83 для Україн и та 0.75 для Індії. Побудовані моделі дозволяють передбачати епідеміологічну ситуацію в майбутньому, координувати дії у різних галузях охорони здоров'я та проводити обґрунтовані превентивні заходи на державному рівні.
dc.description.abstractModels for predicting the number of patients with COVID-19 using machine learning methods have been built. The data for models are obtained from various official sources, including the World Health Organization, from the beginning of the epidemic to the present time. The data in Ukraine and India were selected to teach models for predicting the number of patients with COVID-19. Algorithms of linear regression for Ukraine and gradient boosting for India proved to be the methods that provided high accuracy of the forecast for the existing data. Data analysis was performed using the Python programming language with Sklearn library which is based on SciPy (Scientific Python). In addition, the XGboost gradient boost algorithm library was used. To develop the model, multifactor prediction of time series with the delays as predictors was chosen. It is established that the such characteristics as the date of the event, day of the week, week number, month affect to the model. Model errors are smallest and forecast accuracy were estimated with the best values of 0.83 for Ukraine and 0.75 for India. The built models allow to predict the epidemiological situ ation in the future, to coordinate actions in different areas of health care and to carry out reasonable preventive easures at the state level.
dc.identifier.citationМоделі машинного навчання для передбачення кількості захворілих на COVID-19 в Україні та Індії / Г. М. Хорошун, О. І. Рязанцев, М. О. Коверга, С. А. Покришка // Сучасні інформаційні системи = Advanced Information Systems. – 2022. – Т. 6, № 2. – С. 16-20.
dc.identifier.doidoi.org/10.20998/2522-9052.2022.2.03
dc.identifier.orcidhttps://orcid.org/0000-0002-1272-1222
dc.identifier.orcidhttps://orcid.org/0000-0002-3740-3132
dc.identifier.orcidhttps://orcid.org/0000-0001-9906-4845
dc.identifier.orcidhttps://orcid.org/0000-0002-4092-1221
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/68769
dc.language.isouk
dc.publisherНаціональний технічний університет "Харківський політехнічний інститут"
dc.subjectмашинне навчання
dc.subjectмоделі прогнозування
dc.subjectметод лінійної регресії
dc.subjectметод градієнтного прискорення
dc.subjectmachine learning
dc.subjectprediction models
dc.subjectlinear regression method
dc.subjectgradient boosting method
dc.titleМоделі машинного навчання для передбачення кількості захворілих на COVID-19 в Україні та Індії
dc.title.alternativeMachine learning models for predicting the number of COVID-19 patientsin Ukraine and India
dc.typeArticle

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
AIS_2022_6_2_Khoroshun_Modeli.pdf
Розмір:
6.89 KB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
10.82 KB
Формат:
Item-specific license agreed upon to submission
Опис: