A machine learning screening model for predicting the development of cervical dental lesions

dc.contributor.authorZabolotna, Iryna I.
dc.contributor.authorBogdanova, Tatiana L.
dc.contributor.authorAzarenkov, Volodymyr Illich
dc.contributor.authorGenzytska, Olena S.
dc.contributor.authorKomlev, Andrii A.
dc.date.accessioned2026-04-24T10:44:47Z
dc.date.issued2026
dc.description.abstractIntroduction. Predicting the risk of development of cervical dental pathology is a difficult task due to the multifactorial nature of its etiopathogenesis and limited knowledge of risk factors. Aim. To develop and test a computer model for predicting the development of cervical dental lesions in young patients. Materials and methods. The survey consisted of 272 patients (mean age 24.3 ± 6.9 years), in whom risk factors for the development of a wedge- shaped defect, cervical caries and enamel erosion were determined, which became the input data for the computer model. The Extreme Gradient Boosting (XGBoost) tree-based machine learning method implemented in the Python programming language using the scikit- learn and XGBoost libraries was used. Synthetic Minority Over-sampling Technique (SMOTE) was additionally applied to increase the efficiency of predicting less common enamel erosion among the examined individuals. Results. When developing the models, the priority was given to recall over accuracy and specificity. This contributed to reducing the number of missed cases for each pathology. The highest discriminatory ability (ROC-AUC) = 0.84 (Receiver Operating Characteristic curve – Area under the curve) in combination with a high level of recall (recall = 0.82) corresponded to the model for predicting cervical caries of teeth. This confirmed the feasibility of using the XGBoost algorithm to identify complex relationships in nonlinear combinations of the indicators. The model for predicting a wedge- shaped defect of teeth also had high recall (recall = 0.83) but the moderate value of ROC-AUC (0.64) that emphasizes the presence of nonlinear dependent predictors. Particular scientific interest has the model for predicting erosion of tooth enamel which was created under conditions of a low prevalence of pathology among the examined. However, the results showed an acceptable level of recall (recall = 0.47) and moderate discriminatory ability (ROC-AUC = 0.72). This allowed us to determine that the problem of small sample was successfully solved. Conclusions. The presented machine learning screening model helps identify patients with increased risk of developing cervical dental lesions. Its use will make it possible to justify the prescription of preventive measures to young patients.
dc.description.abstractВступ. Прогнозування ризику виникнення пришийкової патології зубів є складним завданням через багатофакторність її етіопатогенезу та обмежені знання про фактори ризику. Мета. Розробити та апробувати комп’ютерну модель прогнозування розвитку пришийкових уражень зубів у пацієнтів молодого віку. Матеріали та методи. Вибірку склали 272 пацієнти (середній вік 24,3 ± 6,9 роки), у яких було визначено фактори ризику виникнення клиновидного дефекту, пришийкового карієсу, ерозії емалі, що стали вхідними даними до компʼютерної моделі. Було використано метод деревоподібного машинного навчання Extreme Gradient Boosting (XGBoost), реалізований на мові програмування Python із використанням бібліотек scikit-learn і XGBoost. Для підвищення ефективності прогнозування менш поширеної серед обстежених ерозії емалі додатково було застосовано Synthetic Minority Over-sampling Technique (SMOTE). Результати. При розробці моделей було надано пріоритет чутливості (recall) над показниками точності та специфічності. Це сприяло зменшенню кількості пропущених випадків для кожної з патологій. Найвища дискримінаційна здатність (ROC-AUC) = 0,84 (Receiver Operating Characteristic curve – Area under the curve) у поєднанні з високим рівнем чутливості (recall = 0,82) відповідала моделі прогнозування пришийкового карієсу зубів. Це підтвердило доцільність використання алгоритму XGBoost для виявлення складних взаємозв’язків у нелінійних сполученнях показників. Модель прогнозування клиновидного дефекту зубів також мала високу чутливість (recall = 0,83), але помірне значення ROC-AUC (0,64), що підкреслює наявність нелінійно залежних між собою предикторів. Особливий науковий інтерес представляє модель прогнозування ерозії емалі зубів, яка була створена в умовах незначної поширеності патології серед обстежених. Проте отримані результати показали прийнятний рівень чутливості (recall = 0,47) та помірну дискримінаційну здатність (ROC-AUC = 0,72). Це дозволило визначити, що проблема малої вибірки була успішно вирішена. Висновки. Представлена скринінгова модель машинного навчання сприяє ідентифікації осіб з підвищеним ризиком виникнення пришийкових уражень зубів. Її використання дозволить обґрунтувати призначення профілактичних заходів пацієнтам молодого віку.
dc.identifier.citationZabolotna I. I., Bogdanova T. L., Azarenkov V. I., Genzytska O. S., Komlev A. A. A machine learning screening model for predicting the development of cervical dental lesions. Клінічна та профілактична медицина. 2026. № 2 (48). Р. 89-98. https://doi.org/10.31612/2616-4868.2.2026.11. URL: https://cp-medical.com/index.php/journal/article/view/743/656, (advanced 24.04.2026.).
dc.identifier.doihttps://doi.org/10.31612/2616-4868.2.2026.11
dc.identifier.orcidhttps://orcid.org/0000-0001-6305-4944
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/101477
dc.language.isoen
dc.publisherДержавна наукова установа "Центр інноваційних технологій охорони здоров'я" Державного управління справами
dc.subjectdental caries
dc.subjectdental erosion
dc.subjectensemble learning
dc.subjectprevention
dc.subjectrisk factors
dc.subjectкарієс зуба
dc.subjectерозія зуба
dc.subjectансамблеве навчання
dc.subjectпрофілактика
dc.subjectфактори ризику
dc.titleA machine learning screening model for predicting the development of cervical dental lesions
dc.title.alternativeСкринінгова модель машинного навчання для прогнозування виникнення пришийкових уражень зубів
dc.typeArticle

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
KTPM_2026_2_Zabolotna_A_machine.pdf
Розмір:
748.86 KB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
license.txt
Розмір:
11.15 KB
Формат:
Item-specific license agreed upon to submission
Опис: