Особенности экстракции и идентификации знаний web-контента

Хайрова, Нина Феликсовна; Гаутам, Аджит Пратап Сингх

Особенности экстракции и идентификации знаний web-контента

Файли

SUNZ_2014_4_Khairova_Osobennosti_ekstraktcii.pdf (65.5 KB)

Дата

2014

Автори

Хайрова, Нина Феликсовна

Гаутам, Аджит Пратап Сингх

Видавець

Полтавський національний технічний університет ім. Юрія Кондратюка

Анотація

В статье рассматриваются особенности идентификации знаний веб-страниц. Предлагается технология Web Content Mining, включающая выделение основного контента страницы, извлечение смысловых понятий и контентный анализ, использующий регулярные выражения. Разработанные регулярные выражения позволяют выделить отношения таксономии и репрезентативности между концептами веб-страницы.
In the article the features of knowledge mining and knowledge identification of web-pages have been considered. The new kind technology of Web Content Mining has been elaborated. The technology is based on the method of extraction of semantic concepts from textual information and includes the steps: exarticulation of the main page-content, extraction of the semantic concepts and the content analysis. At the stage of content analysis regular expressions have been used. The regular expressions allow to manifestly distinguish relationships of the representation and taxonomy between concepts of the webpage. As elements of regular expressions were used nouns, nouns groups and special lexical constructs.

Ключові слова

регулярные выражения, таксономия, отношение репрезентативности, Web Content Mining, identification of knowledge, regular expressions, taxonomy, attitude of representativeness

Бібліографічний опис

Хайрова Н. Ф. Особенности экстракции и идентификации знаний web-контента / Н. Ф. Хайрова, А. П. С. Гаутам // Системи управління, навігації та зв'язку : зб. наук. пр. / гол. редкол. С. В. Козелков. – Полтава : ПНТУ, 2014. – Вип. 4 (32). – С. 190-193.

URI

https://repository.kpi.kharkov.ua/handle/KhPI-Press/49752

Колекції

Кафедра "Інтелектуальні комп'ютерні системи"

Повна інформація про документ
Google Scholar

Особенности экстракции и идентификации знаний web-контента

Файли

Дата

Автори

ORCID

DOI

Науковий ступінь

Рівень дисертації

Шифр та назва спеціальності

Рада захисту

Установа захисту

Науковий керівник/консультант

Члени комітету

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Опис

Ключові слова

Бібліографічний опис

URI

Колекції

Підтвердження

Рецензія

Додано до

Згадується в