Кафедри
Постійне посилання на розділhttps://repository.kpi.kharkov.ua/handle/KhPI-Press/35393
Переглянути
3 результатів
Результати пошуку
Документ Построение разделяющей поверхности двух точечных множеств на основе поиска ближайших соседей(Національний технічний університет "Харківський політехнічний інститут", 2018) Дашкевич, Андрей АлександровичДокумент Алгоритм построения разделяющей поверхности двух точечных множеств методом разбиения пространства на регулярную сетку(Таврійський державний агротехнологічний університет, 2018) Дашкевич, Андрей АлександровичВ работе рассмотрен подход к решению задачи классификации данных двух точечных множеств на основе построения их разделяющей поверхности. Предлагается понятие гиперкуба, как расширение метода пространственного хеширования. Обобщенный подход к построению разделяющей поверхности двух точечных множеств заключается в разбиении пространства, занимаемого множествами на регулярную сетку с помощью метода пространственного хеширования, построения гиперкуба для полученной сетки и нахождения значений в ячейках гиперкуба методом проведения дискретизированных гиперпрямых для нахождения средней ячейки гиперкуба между двумя ячейками, принадлежащими разным классам. Наиболее вероятный класс для новых точек определяется знаком и модулем значения в той ячейке гиперкуба, в которой находится эта точка. Преимуществом предложенного подхода является простота вычислений и возможность расширения для данных произвольной размерности.Документ Сигнатура точечного множества и алгоритм классификации на её основе(Национальный технический университет "Харьковский политехнический институт", 2018) Дашкевич, Андрей АлександровичНа данный момент существует большое количество задач по автоматизированной обработке многомерных данных, например, классификация, кластеризация, прогнозирование, задачи управления сложными объектами. Соответственно, возникает необходимость в развитии математического и алгоритмического обеспечения для решения возникающих задач. Целью исследования является развитие алгоритмов классификации точечных множеств на основе их пространственного распределения. В работе предлагается рассматривать данные как точки в многомерном метрическом пространстве. В работе рассмотрены подходы к описанию характеристик точечных множеств в пространствах высокой размерности и предлагается подход к описанию точечного множества на основе сигнатур, которые представляют собой характеристику заполненности точечного множества на основе расширения понятия пространственного хеширования. Обобщенный подход к вычислению сигнатур точечных множеств заключается в разбиении пространства, занимаемого множеством на регулярную сетку с помощью метода пространственного хеширования, вычисления геометрических характеристик множества в полученных ячейках и определения наиболее заполненных ячеек по каждому из пространственных измерений. Предлагается новый подход к классификации на основе сигнатур множества, который заключается в нахождении сигнатур для точек с известным значением принадлежности к некоторым классам, а для новых точек вычисляется расстояние от хеша точки до сигнатуры каждого из известных множеств, на основе чего определяется наиболее вероятный класс точки. В качестве используемых метрик предлагаются Евклидово расстояние и метрика городских кварталов. В работе проведён сравнительный анализ используемых метрик с точки зрения точности классификации. Преимуществами предложенного подхода являются простота вычислений и высокая степень точности классификации для равномерно распределенных точек. Представленный алгоритм реализован в виде программного приложения на языке Python с использованием библиотеки NumPy. Также рассмотрены варианты использования предложенного подхода для задач с не числовыми данными, такими как строковые и булевы значения. Для таких данных предложено использовать метрику Хэмминга, проведённые эксперименты показали работоспособность алгоритма для таких типов данных.