Failure rate regression model building from aggregated data using kernel-based machine learning
Дата
2022
DOI
doi.org/10.20998/2079-0023.2022.02.08
Науковий ступінь
Рівень дисертації
Шифр та назва спеціальності
Рада захисту
Установа захисту
Науковий керівник
Члени комітету
Назва журналу
Номер ISSN
Назва тому
Видавець
Національний технічний університет "Харківський політехнічний інститут"
Анотація
The problem of regression model building of equipment failure rate using datasets containing information on number of failures of recoverable systems and measurements of technological and operational factors affecting the reliability of production system is considered. This problem is important for choosing optimal strategy for preventive maintenance and restoration of elements of process equipment, which, in turn, significantly affects the efficiency of production management system. From a practical point of view, of greatest interest is the development of methods for regression models building to assess the impact of various technological and operational factors controlled during system operation on failure rate. The usual approach to regression
models construction involves preselecting the model structure in the form of a parameterized functional relationship between failure rate and affecting technological variables followed by statistical estimation of unknown model parameters or training the model on datasets of measured covariates and failures.The main problem lies precisely in the choice of model structure, the complexity of which should correspond to amount of data available for training model, which in the problem of failure rate modeling is greatly complicated by lack of a priori information about its dependence on affecting variables. In this work, such a problem is solved using machine learning methods, namely, kernel ridge regression, which makes it possible to effectively approximate complex nonlinear dependences of equipment failure rate on technological factors, while there is no need to pre-select the model structure. Preliminary aggregation of data by combination of factor and cluster analysis can significantly simplify model structure. The proposed technique is illustrated by solving a practical problem of failure rate model building for semiconductor production equipment based on real data.
Розглянуто задачу побудови регресійної моделі інтенсивності відмов обладнання з використанням наборів даних, що містять інформацію про кількість відмов відновлюваних систем та вимірювання технологічних і експлуатаційних факторів, що впливають на надійність виробничої системи. Ця проблема є важливою для вибору оптимальної стратегії профілактичного ремонту та відновлення елементів технологічного обладнання, що, у свою чергу, суттєво впливає на ефективність системи управління виробництвом. З практичної точки зору найбільший інтерес представляє розробка методів побудови регресійних моделей для оцінки впливу на інтенсивність відмов різноманітних технологічних та експлуатаційних факторів, контрольованих під час роботи системи. Звичайний підхід до побудови регресійних моделей передбачає попередній вибір структури моделі у формі параметризованого функціонального зв’язку між інтенсивністю відмов і технологічними змінними з наступною статистичною оцінкою невідомих параметрів моделі або навчанням моделі на наборах даних виміряних коваріат і відмов. Основна проблема полягає саме у виборі структури моделі, складність якої повинна відповідати кількості даних, доступних для навчання моделі, що в задачі моделювання інтенсивності відмов значно ускладнюється відсутністю апріорної інформації про її залежність від впливаючих змінних. У даній роботі така задача вирішується за допомогою методів машинного навчання, а саме ядерної гребневої регресії, що дає змогу ефективно апроксимувати складні нелінійні залежності інтенсивності відмов обладнання від технологічних факторів, при цьому немає необхідності попереднього вибору структури моделі. Попереднє агрегування даних шляхом поєднання факторного та кластерного аналізу може значно спростити структуру моделі. Пропонована методика проілюстрована розв’язанням практичної задачі побудови моделі інтенсивності відмов обладнання для виробництва напівпровідників на основі реальних даних.
Розглянуто задачу побудови регресійної моделі інтенсивності відмов обладнання з використанням наборів даних, що містять інформацію про кількість відмов відновлюваних систем та вимірювання технологічних і експлуатаційних факторів, що впливають на надійність виробничої системи. Ця проблема є важливою для вибору оптимальної стратегії профілактичного ремонту та відновлення елементів технологічного обладнання, що, у свою чергу, суттєво впливає на ефективність системи управління виробництвом. З практичної точки зору найбільший інтерес представляє розробка методів побудови регресійних моделей для оцінки впливу на інтенсивність відмов різноманітних технологічних та експлуатаційних факторів, контрольованих під час роботи системи. Звичайний підхід до побудови регресійних моделей передбачає попередній вибір структури моделі у формі параметризованого функціонального зв’язку між інтенсивністю відмов і технологічними змінними з наступною статистичною оцінкою невідомих параметрів моделі або навчанням моделі на наборах даних виміряних коваріат і відмов. Основна проблема полягає саме у виборі структури моделі, складність якої повинна відповідати кількості даних, доступних для навчання моделі, що в задачі моделювання інтенсивності відмов значно ускладнюється відсутністю апріорної інформації про її залежність від впливаючих змінних. У даній роботі така задача вирішується за допомогою методів машинного навчання, а саме ядерної гребневої регресії, що дає змогу ефективно апроксимувати складні нелінійні залежності інтенсивності відмов обладнання від технологічних факторів, при цьому немає необхідності попереднього вибору структури моделі. Попереднє агрегування даних шляхом поєднання факторного та кластерного аналізу може значно спростити структуру моделі. Пропонована методика проілюстрована розв’язанням практичної задачі побудови моделі інтенсивності відмов обладнання для виробництва напівпровідників на основі реальних даних.
Опис
Ключові слова
dependability, factor analysis, failure rate, kernel methods, machine learning, production processes, preventive maintaince, ridge regression, regression model, надійність, факторний аналіз, рівень відмов, ядерні методи, машинне навчання, виробничі процеси, прогнозне технічне обслуговування, хребтова регресія, регресійна модель
Бібліографічний опис
Failure rate regression model building from aggregated data using kernel-based machine learning / O. B. Akhiiezer, G. L. Grinberg, L. M. Lyubchyk, K. S. Yamkovyi // Вісник Національного технічного університету "ХПІ". Сер. : Системний аналіз, управління та інформаційні технології = Bulletin of the National Technical University "KhPI". Ser. : System analysis, control and information technology : зб. наук. пр. – Харків : НТУ "ХПІ", 2022. – № 2 (8). – С. 51-56.