Дослідження вибірок експериментальних даних на наявність викидів: порівняння методів

dc.contributor.authorПотаніна, Тетяна Володимирівна
dc.contributor.authorМихайленко, І. В.
dc.date.accessioned2023-12-18T13:23:03Z
dc.date.available2023-12-18T13:23:03Z
dc.date.issued2023
dc.description.abstractЗадача виявлення викидів (промахів, аномальних значень, результатів, що різко виділяються, результатів, що відірвалися) є однією з найактуальніших, складних і неоднозначних при обробці експериментального матеріалу. Такими значеннями вважаються результати експерименту, які знаходяться аномально далеко від інших точок із серії паралельних спостережень. Джерелом викидів нерідко є похибки вимірювань. Серед таких є невірний запис результатів експерименту, можливе неправильне кодування даних, некоректне проведення експерименту тощо. Грубі похибки виникають при різкій зміні умов проведення дослідження, несправностях в роботі апаратури й т.і. Одночасно викиди можуть свідчити про неочікувану, неординарну поведінку вимірюваної величини, яка є проявом ще не з’ясованої властивості процесу. І тому потрібен аналіз з застосуванням надійного математичного інструментарія. Методи виявлення викидів різноманітні і численні. Параметричні тести мають більшу чутливість до розміру вибірки і до ймовірнісного розподілу значень сукупності. Більш гнучкими є непараметричні тести, які можна застосувати, якщо не можна зробити припущення про нормальність вибіркової сукупності або обсяг вибірки малий; такі критерії дають кращий результат в асиметричних розподілах, тому що застосовують медіану замість середнього; їх можна застосовувати для порядкових або номінальних даних, а також в ситуації аберрантного значення викиду. Методи інтервального аналізу, зокрема інтервальної статистики, є альтернативним гнучким інструментарієм для отримання більш точного та повного аналізу експериментальних даних за наявності неповної інформації, шумів, викидів вимірювань, наявності аномальних та аберрантних точок. Проведено порівняння результатів застосування параметричних критеріїв (-критерій, -критерій, Львовського) та непараметричних критеріїв (правило «скриньки з вусами») виявлення викидів, а також обчислення методами інтервальної статистики. Один з викидів був визначений таким непараметричним критерієм, -критерієм і процедурою виявлення поодинокого викиду інтервальними методами. Ще два значення були виявлені, як підозрілі викиди за допомогою правила «скринька з вусами» і алгоритму розпізнання з інтервальної статистики. Методи виявлення викидів методами інтервального аналізу є не менш ефективними, ніж застосування непараметричних тестів.
dc.description.abstractThe task of detecting outliers (misses, abnormalous values, results that stand out sharply, results that have come off) is one of the most relevant, complex and ambiguous in the experimental materialprocessing. Such values are the experiment results, which are abnormally far from other points from a series of parallel observations. The source of emissions is often measurement errors. Among these are incorrect recording of the experiment results, possible incorrect coding of data, incorrect conduct of the experiment, etc. Gross errors occur in the event of a sudden change in the conditions of conducting the research, malfunctions in the operation of the equipment, etc. At the same time, outliers may indicate an unexpected, extraordinary behavior of the measured value – a yet-to-be-explained property process manifestation. And that's why an analysis using reliable mathematical tools is needed. The methods of detecting emissions are diverse and numerous. Parametric tests are more sensitive to the sample size and to the population values probability distribution. Nonparametric tests are more flexible and can be applied if the non-normal distributon of the sample or the sample size is small; such criteria give a better result in asymmetric distributions, because they use the median instead of the mean; they can be applied to ordinal or nominal data, as well as in the situation of an aberrant outlier value. Interval analysis methods, in particular interval statistics, are an alternative flexible toolkit for obtaining a more accurate and complete analysis of experimental data in the incomplete information, noise presence, measurement outliers, and the presence of abnormalous and aberrant points. A comparison of the results of the application of parametric criteria ( 2 -criterion, 3-criterion, Lvovskyi) and non-parametric criteria (the box-and-whiskers-plot) for detecting emissions, as well as calculation using interval statistics methods, was carried out. One of the outliers was determined by the non-parametric criterion, the -criterion and the procedure for detecting a single outlier using interval methods. Two values are suspicious outliers using the box-whisker rule and the interval statistics recognition algorithm. The methods of detecting outliers using interval analysis methods are no less effective than the use of non-parametric tests.
dc.identifier.citationПотаніна Т. В. Дослідження вибірок експериментальних даних на наявність викидів: порівняння методів / Т. В. Потаніна, І. В. Михайленко // Інтегровані технології та енергозбереження. – 2023. – № 3. – С. 78-89.
dc.identifier.doihttps://doi.org/10.20998/2078-5364.2023.3.07
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/71971
dc.language.isouk
dc.publisherНаціональний технічний університет "Харківський політехнічний інститут"
dc.subjectпромахи вимірювань
dc.subjectвикиди
dc.subjectмалі вибірки
dc.subjectнестатистичні похибки вимірювань
dc.subjectневизначеність
dc.subjectпараметричні критерії
dc.subjectнепараметричні критерії
dc.subjectінтервальний аналіз
dc.subjectузгоджені вибірки
dc.subjectнеузгоджені вибірки
dc.subjectінтервальна статистика
dc.subjectoutliers
dc.subjectsmall sample
dc.subjectnon statistical measurement errors
dc.subjectuncertainty
dc.subjectparametric and non-parametric detection outliers criterions
dc.subjectinterval analysis
dc.subjectcompatible and incompatible sample
dc.subjectinterval statistics
dc.titleДослідження вибірок експериментальних даних на наявність викидів: порівняння методів
dc.title.alternativeExamination of experimental data samples for the presence of outliers: comparison of methods
dc.typeArticle

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
ITE_2023_3_Potanina_Dosliddzhennia_vybirok.pdf
Розмір:
301.66 KB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
license.txt
Розмір:
1.71 KB
Формат:
Item-specific license agreed upon to submission
Опис: