Особенности экстракции и идентификации знаний web-контента
Дата
2014
ORCID
DOI
Науковий ступінь
Рівень дисертації
Шифр та назва спеціальності
Рада захисту
Установа захисту
Науковий керівник
Члени комітету
Назва журналу
Номер ISSN
Назва тому
Видавець
Полтавський національний технічний університет ім. Юрія Кондратюка
Анотація
В статье рассматриваются особенности идентификации знаний веб-страниц. Предлагается технология Web Content Mining, включающая выделение основного контента страницы, извлечение смысловых понятий и контентный анализ, использующий регулярные выражения. Разработанные регулярные выражения позволяют выделить отношения таксономии и репрезентативности между концептами веб-страницы.
In the article the features of knowledge mining and knowledge identification of web-pages have been considered. The new kind technology of Web Content Mining has been elaborated. The technology is based on the method of extraction of semantic concepts from textual information and includes the steps: exarticulation of the main page-content, extraction of the semantic concepts and the content analysis. At the stage of content analysis regular expressions have been used. The regular expressions allow to manifestly distinguish relationships of the representation and taxonomy between concepts of the webpage. As elements of regular expressions were used nouns, nouns groups and special lexical constructs.
In the article the features of knowledge mining and knowledge identification of web-pages have been considered. The new kind technology of Web Content Mining has been elaborated. The technology is based on the method of extraction of semantic concepts from textual information and includes the steps: exarticulation of the main page-content, extraction of the semantic concepts and the content analysis. At the stage of content analysis regular expressions have been used. The regular expressions allow to manifestly distinguish relationships of the representation and taxonomy between concepts of the webpage. As elements of regular expressions were used nouns, nouns groups and special lexical constructs.
Опис
Ключові слова
регулярные выражения, таксономия, отношение репрезентативности, Web Content Mining, identification of knowledge, regular expressions, taxonomy, attitude of representativeness
Бібліографічний опис
Хайрова Н. Ф. Особенности экстракции и идентификации знаний web-контента / Н. Ф. Хайрова, А. П. С. Гаутам // Системи управління, навігації та зв'язку : зб. наук. пр. / гол. редкол. С. В. Козелков. – Полтава : ПНТУ, 2014. – Вип. 4 (32). – С. 190-193.