Мікросервіс заповнення моделі знань термінів‑визначень із документів PDF формату
| dc.contributor.author | Глєбов, Євгеній | |
| dc.contributor.author | Заволодько, Ганна Едвардівна | |
| dc.date.accessioned | 2025-12-04T08:44:25Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | The article describes a microservice for automated generation of ‘term-definition’ pairs from documents, in particular PDF files with complex internal structure. The processing pipeline includes file type identification, text extraction using the pdfplumber library, normalisation and artefact removal, segmentation, identification of defining structures based on templates and heuristics, and generation of results in JSON format for integration into educational systems. The development supports Ukrainian and English languages, has the prospect of expansion to other formats and integration with NLP models to improve semantic relevance. The advantages of the solution are transparent architecture, efficiency, stability when working with heterogeneous PDFs, and no need for additional model training. | |
| dc.identifier.citation | Глєбов Є. Мікросервіс заповнення моделі знань термінів‑визначень із документів PDF формату / Євгеній Глєбов, Ганна Заволодько // Innovation and digital transformation: education, economy and society dimensions : coll. monograph / ed. by: Tetyana Nestorenko, Nazar Dobosh ; University of Technology in Katowice Press. – Katowice : UTKP, 2025. – P. 167-173. | |
| dc.identifier.orcid | https://orcid.org/0000-0003-0000-8910 | |
| dc.identifier.uri | https://repository.kpi.kharkov.ua/handle/KhPI-Press/95936 | |
| dc.language.iso | uk | |
| dc.publisher | The University of Technology in Katowice Press | |
| dc.subject | мікросервіси | |
| dc.subject | моделі знань | |
| dc.subject | терміни-визначення | |
| dc.subject | PDF-документи | |
| dc.subject | конвертація | |
| dc.subject | вилучення інформації | |
| dc.title | Мікросервіс заповнення моделі знань термінів‑визначень із документів PDF формату | |
| dc.title.alternative | Microservice for populating a knowledge model of term-definition pairs from pdf documents | |
| dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Hliebov_Mikroservis_zapovnennia_2025.pdf
- Розмір:
- 582.88 KB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Вантажиться...
- Назва:
- license.txt
- Розмір:
- 11.25 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис:
