Excel-орієнтований калькулятор для обчислення результатів ентропійного аналізу даних, що розподілені по категоріях
Дата
2023
DOI
https://doi.org/10.20998/2522-9052.2023.2.05
Науковий ступінь
Рівень дисертації
Шифр та назва спеціальності
Рада захисту
Установа захисту
Науковий керівник
Члени комітету
Назва журналу
Номер ISSN
Назва тому
Видавець
Національний технічний університет "Харківський політехнічний інститут"
Анотація
Розробка EXCEL-орієнтованого калькулятора для обчислення результатів ентропійного аналізу даних, які розподілені по категоріях. Предмет дослідження – гістограми довільних законів розподілу та таблиці спряженості 2×2. Методи дослідження: Ентропійний та інформаційний аналіз гістограм довільних законів розподілу та таблиць спряженості 2×2. Отримані результати. Запропоновано використовувати методи ентропійного аналізу для аналізу даних, що розподілені по категоріях та наведено відомості про структуру excel-орієнтованого калькулятора, призначеного для виконання таких розрахунків. Калькулятор дає можливість обчислювати ентропійні характеристики гістограм, виконувати попарне порівняння ентропій гістограм, визначати відстань між гістограмами, обчислювати інформаційний коефіцієнт кореляції, порівнювати розбіжності між гістограмами. Для таблиць спряженості 2×2 калькулятор дає можливість оцінювати значущость взаємодії фактору рядків та фактору стовпців. Калькулятор визначає значення умовних ентропій для таблиць спряженості 2×2. Запропонований калькулятор у деякій мірі заповнює прогалини в існуючих програмних продуктах та може бутий використаний для обробки методами ентропійного аналізу даних, що розподілені по категоріях.
Development of EXCEL-oriented calculator for calculating the results of entropy analysis of data, which are distributed by categories. The subject of research is histograms of arbitrary distribution laws and conjugation tables 2×2. Research methods: Entropy and information analysis of histograms of arbitrary distribution laws and conjugation tables. The obtained results. It is proposed to use methods of entropy analysis for the analysis of data distributed by categories; information on the structure of the EXCEL-oriented calculator designed for this purpose is given. The calculator makes it possible to calculate entropy characteristics of histograms, namely: histogram entropy, histogram disper-sion, histogram confidence intervals, diversity information index. The calculator performs a pairwise comparison of entropies of histograms using the Hutcheson method, determines Hellinger and Kullback-Leibler distances between histograms of arbi-trary distribution laws and thus complements the chi-square criterion, determines the informational correlation coefficient. The correspondence between the Pearson correlation coefficient and the information correlation coefficient is established by the method of statistical modeling. For 2×2 conjugation tables, the calculator makes it possible to estimate the significance of the interaction between the row factor and the column factor. The calculator determines the values of conditional entropies for 2×2 conjugation tables. The proposed calculator fills the gaps in existing software products and can be used to process data distributed by categories using entropy analysis methods. It is shown that entropy methods of analysis are appropriate to use in cases where histograms determine arbitrary distribution laws.
Development of EXCEL-oriented calculator for calculating the results of entropy analysis of data, which are distributed by categories. The subject of research is histograms of arbitrary distribution laws and conjugation tables 2×2. Research methods: Entropy and information analysis of histograms of arbitrary distribution laws and conjugation tables. The obtained results. It is proposed to use methods of entropy analysis for the analysis of data distributed by categories; information on the structure of the EXCEL-oriented calculator designed for this purpose is given. The calculator makes it possible to calculate entropy characteristics of histograms, namely: histogram entropy, histogram disper-sion, histogram confidence intervals, diversity information index. The calculator performs a pairwise comparison of entropies of histograms using the Hutcheson method, determines Hellinger and Kullback-Leibler distances between histograms of arbi-trary distribution laws and thus complements the chi-square criterion, determines the informational correlation coefficient. The correspondence between the Pearson correlation coefficient and the information correlation coefficient is established by the method of statistical modeling. For 2×2 conjugation tables, the calculator makes it possible to estimate the significance of the interaction between the row factor and the column factor. The calculator determines the values of conditional entropies for 2×2 conjugation tables. The proposed calculator fills the gaps in existing software products and can be used to process data distributed by categories using entropy analysis methods. It is shown that entropy methods of analysis are appropriate to use in cases where histograms determine arbitrary distribution laws.
Опис
Ключові слова
ентропія, інформаційний коефіцієнт кореляції, відстань Хелінгера, відстань Кулльбака-Леблера, ентропійний аналіз, entropy, entropy analysis, information correlation coefficient, Hellinger distance, Kullback-Leibler distance
Бібліографічний опис
Excel-орієнтований калькулятор для обчислення результатів ентропійного аналізу даних, що розподілені по категоріях / С. В. Гадецька [та ін.] // Сучасні інформаційні системи = Advanced Information Systems. – 2023. – Т. 7, № 2. – С. 28-40.