Дослідження властивостей середовища керування даними та оцінка часу передачі великих наборів даних

dc.contributor.authorБроварник, Олексій Олексійовичuk
dc.contributor.authorОвсяніков, Владислав Валерійовичuk
dc.date.accessioned2023-02-21T13:22:55Z
dc.date.available2023-02-21T13:22:55Z
dc.date.issued2022
dc.description.abstractУ статті розглядається задача оцінювання часу передачі великих наборів даних через розподілене середовище керування даними на основі самостійно створеної моделі нейронної мережі та дослідження властивостей цього середовища за допомогою методів статистичного аналізу. Для початкового аналізу отримано метадані для успішних передач файлів в системі, трансформовано та виділено змінні, які впливають на час передачі файлів. Під час аналізу використані різні вибірки, щоб перевірити, чи схожі результати в усіх наявних даних. Застосовано методи кореляційного, регресійного аналізу для дослідження середовища. Виявлено, що не існує чіткої кореляції між часом передачі та одним з вхідних параметрів. Час передачі файлу залежить від ряду зовнішніх факторів, які неможливо отримати за допомогою метаданих, але можливо частково дослідити середовище використовуючи отримані метадані. Використано модель на основі двох вхідних рівнів для числових та категоріальних змінних, а потім об’єднаних в одну гілку. Для зображення результатів передбачення використовуються показники RMSE та діаграма розсіювання для порівняння цільових та передбачених значень. Проведені розрахунки показують задовільні результати передбачень.uk
dc.description.abstractThe article considers the task of estimating the time of transmission of large data sets through a distributed data management environment based on a self-created neural network model and investigating the properties of this environment using statistical analysis methods. For the initial analysis, metadata for successful file transfers in the system was obtained, variables that affect file transfer time were transformed and highlighted. Different samples were used in the analysis to check whether the results were similar across the available data. The methods of correlation and regression analysis are applied for the study of the environment. It was found that there is no clear correlation between the transmission time and one of the input parameters. The file transfer time depends on a number of external factors that cannot be obtained using metadata, but it is possible to partially investigate the environment using the obtained metadata. A model based on two input levels for numerical and categorical variables was used and then combined into one branch. RMSE metric value and a scatter plot are used to display the prediction results to compare the target and predicted values. The performed calculations show satisfactory prediction results.en
dc.identifier.citationБроварник О. О. Дослідження властивостей середовища керування даними та оцінка часу передачі великих наборів даних / О. О. Броварник, В. В. Овсяніков // Вісник Національного технічного університету "ХПІ". Сер. : Інноваційні дослідження у наукових роботах студентів : зб. наук. пр. = Bulletin of the National Technical University "KhPI". Ser. : Innovation researches in students’ scientific work : coll. of sci. papers / Нац. техн. ун-т "Харків. політехн. ін-т" ; гол. ред. С. І. Бухкало. – Харків : НТУ "ХПІ", 2022. – № 2 (1364). – С. 23-28.uk
dc.identifier.doidoi.org/10.20998/2220-4784.2022.02.04
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/62616
dc.language.isouk
dc.publisherНаціональний технічний університет "Харківський політехнічний інститут"uk
dc.subjectдослідження властивостейuk
dc.subjectоцінка часу передачіuk
dc.subjectметоди статистичного аналізуuk
dc.subjectаналіз данихuk
dc.subjectрегресіяuk
dc.subjectкореляціяuk
dc.subjectнейронна мережаuk
dc.subjectresearch of propertiesen
dc.subjecttransmission time estimationen
dc.subjectmethods of statistical analysisen
dc.subjectdata analysisen
dc.subjectregressionen
dc.subjectcorrelationen
dc.subjectneural networken
dc.titleДослідження властивостей середовища керування даними та оцінка часу передачі великих наборів данихuk
dc.title.alternativeData management environment properties investigation and time estimation of large data set transferen
dc.typeArticleen

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
visnyk_KhPI_2022_2_IDNRS_Brovarnyk_Doslidzhennia.pdf
Розмір:
982.02 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
1.71 KB
Формат:
Item-specific license agreed upon to submission
Опис: