Особенности экстракции и идентификации знаний web-контента

Ескіз

Дата

2014

ORCID

DOI

Науковий ступінь

Рівень дисертації

Шифр та назва спеціальності

Рада захисту

Установа захисту

Науковий керівник

Члени комітету

Назва журналу

Номер ISSN

Назва тому

Видавець

Полтавський національний технічний університет ім. Юрія Кондратюка

Анотація

В статье рассматриваются особенности идентификации знаний веб-страниц. Предлагается технология Web Content Mining, включающая выделение основного контента страницы, извлечение смысловых понятий и контентный анализ, использующий регулярные выражения. Разработанные регулярные выражения позволяют выделить отношения таксономии и репрезентативности между концептами веб-страницы.
In the article the features of knowledge mining and knowledge identification of web-pages have been considered. The new kind technology of Web Content Mining has been elaborated. The technology is based on the method of extraction of semantic concepts from textual information and includes the steps: exarticulation of the main page-content, extraction of the semantic concepts and the content analysis. At the stage of content analysis regular expressions have been used. The regular expressions allow to manifestly distinguish relationships of the representation and taxonomy between concepts of the webpage. As elements of regular expressions were used nouns, nouns groups and special lexical constructs.

Опис

Ключові слова

регулярные выражения, таксономия, отношение репрезентативности, Web Content Mining, identification of knowledge, regular expressions, taxonomy, attitude of representativeness

Бібліографічний опис

Хайрова Н. Ф. Особенности экстракции и идентификации знаний web-контента / Н. Ф. Хайрова, А. П. С. Гаутам // Системи управління, навігації та зв'язку : зб. наук. пр. / гол. редкол. С. В. Козелков. – Полтава : ПНТУ, 2014. – Вип. 4 (32). – С. 190-193.

Підтвердження

Рецензія

Додано до

Згадується в