Особенности экстракции и идентификации знаний web-контента
dc.contributor.author | Хайрова, Нина Феликсовна | ru |
dc.contributor.author | Гаутам, Аджит Пратап Сингх | ru |
dc.date.accessioned | 2020-12-10T13:36:12Z | |
dc.date.available | 2020-12-10T13:36:12Z | |
dc.date.issued | 2014 | |
dc.description.abstract | В статье рассматриваются особенности идентификации знаний веб-страниц. Предлагается технология Web Content Mining, включающая выделение основного контента страницы, извлечение смысловых понятий и контентный анализ, использующий регулярные выражения. Разработанные регулярные выражения позволяют выделить отношения таксономии и репрезентативности между концептами веб-страницы. | ru |
dc.description.abstract | In the article the features of knowledge mining and knowledge identification of web-pages have been considered. The new kind technology of Web Content Mining has been elaborated. The technology is based on the method of extraction of semantic concepts from textual information and includes the steps: exarticulation of the main page-content, extraction of the semantic concepts and the content analysis. At the stage of content analysis regular expressions have been used. The regular expressions allow to manifestly distinguish relationships of the representation and taxonomy between concepts of the webpage. As elements of regular expressions were used nouns, nouns groups and special lexical constructs. | en |
dc.identifier.citation | Хайрова Н. Ф. Особенности экстракции и идентификации знаний web-контента / Н. Ф. Хайрова, А. П. С. Гаутам // Системи управління, навігації та зв'язку : зб. наук. пр. / гол. редкол. С. В. Козелков. – Полтава : ПНТУ, 2014. – Вип. 4 (32). – С. 190-193. | ru |
dc.identifier.uri | https://repository.kpi.kharkov.ua/handle/KhPI-Press/49752 | |
dc.language.iso | ru | |
dc.publisher | Полтавський національний технічний університет ім. Юрія Кондратюка | uk |
dc.subject | регулярные выражения | ru |
dc.subject | таксономия | ru |
dc.subject | отношение репрезентативности | ru |
dc.subject | Web Content Mining | en |
dc.subject | identification of knowledge | en |
dc.subject | regular expressions | en |
dc.subject | taxonomy | en |
dc.subject | attitude of representativeness | en |
dc.title | Особенности экстракции и идентификации знаний web-контента | ru |
dc.title.alternative | Features extraction and identification of knowledge Web-content | en |
dc.type | Article | en |
Файли
Контейнер файлів
1 - 1 з 1
- Назва:
- SUNZ_2014_4_Khairova_Osobennosti_ekstraktcii.pdf
- Розмір:
- 65.5 KB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 11.25 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: