Please use this identifier to cite or link to this item: http://repository.kpi.kharkov.ua/handle/KhPI-Press/27148
Title: Автоматизація створення сховища даних електронних документів з Веб-порталів відкритих даних
Other Titles: Automating of creation of electronic documents warehouse on web-portals of open data
Authors: Кунгурцев, Олексій Борисович
Блажко, Олександр Анатолійович
Ковальчук, Сергій Вікторович
Скрипкін, Михайло Олександрович
Keywords: зв`язані данні; синтаксичний аналізатор; RDF-моделі; HTML-формат; linked data; data parser
Issue Date: 2016
Publisher: НТУ "ХПІ"
Citation: Автоматизація створення сховища даних електронних документів з Веб-порталів відкритих даних / О. Б. Кунгурцев [та ін.] // Вісник Нац. техн. ун-ту "ХПІ" : зб. наук. пр. Сер. : Механіко-технологічні системи та комплекси. – Харків : НТУ "ХПІ", 2016. – № 4 (1176). – С. 31-37.
Abstract: Розглядається процес створення сховища даних електронних документів національного Веб-порталу відкритих даних України. Для скорочення трудомісткості процесу запропоновано розвиток методу порівняння текстів шляхом визначення інтегральної близькості структурованих текстів та їх елементів у вигляді рядків і стовпців, що дозволяє автоматизувати процес встановлення зв'язку між наборами даних при створенні сховища. Програмне забезпечення методу апробовано на наборах відкритих даних національного Веб-порталу. Результати дослідження можуть бути використані при створенні сховищ даних в системах електронного документообігу.
The paper considers the process of creating of electronic documents in data warehouse on the web-portal of open data.The result of this study is the method of text comparison for two structured electronic documents, which presented in tabular form to determine the possibility of their association in the data warehouse. The Scientific novelty of work is improvement of method for comparing the texts with integrated proximity of structured texts and their elements in rows and columns in a table, which allows to automate the process of establishing a semantic link between the data sets to create a data warehouse. The software of proposed method is approved by the example of the DOC-format documents on the web-site of the Main Statistical Office in the Odessa region, which stores the operational statistics of socio-economic development of the region. For the experiments was created a public Web-portal of open data at the Odessa area on the basis of free software DKAN. As a result of automated analysis of documents with data tables were created open data sets. For more than half sets automatically semantic links have been established and carried out the union of these sets into a single data warehouse. It will allow a more qualitative analytical assessment of socio-economic processes using diagrams and cartographic type of visualization. The results of work can be used to create any kind of data warehouse in electronic document management systems.
URI: http://repository.kpi.kharkov.ua/handle/KhPI-Press/27148
Appears in Collections:Вісник № 04

Files in This Item:
File Description SizeFormat 
vestnik_KhPI_2016_4_Kunhurtsev_Avtomatyzatsiia.pdf491,65 kBAdobe PDFThumbnail
View/Open
Show full item record  Google Scholar



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.