Лингвистические инструменты выявления криминально окрашенной текстовой информации веб-контента

dc.contributor.authorМамырбаев, Оркен Жумажановичru
dc.contributor.authorМусхина, Куралай Женисбековнаru
dc.contributor.authorХайрова, Нина Феликсовнаru
dc.contributor.authorКолесник, А. С.ru
dc.date.accessioned2020-12-11T09:02:23Z
dc.date.available2020-12-11T09:02:23Z
dc.date.issued2018
dc.description.abstractВ работе рассматриваются виды криминально окрашенной текстовой информации Web-контента (киберпреступность, террористический акт или финансовое мошенничество) и анализируются существующие технологии лингвистического анализа, позволяющие выявлять противоправную информацию в текстах. Проводится аналитический обзор использования существующих инструментов обработки языка, позволяющий выявить проблемы использования традиционных подходов NLP для анализа криминально значимой текстовой информации. Предлагаемый метод базируется на подходах Information Extraction и фокусируется на методе извлечения фактов из cлабоструктурированных текстов. Рассматривается использование технологии, базирующейся на описании семантических функций средствами алгебры конечных предикатов, для извлечения слабоструктурированных фактов из предложений русского и английского языков. Анализируется возможность использования предложенной технологии для текстов казахского языка.ru
dc.description.abstractThe paper deals with types of criminally colored textual information of Web content (cybercrime, terrorist act or financial fraud) and analyzes existing technologies of linguistic analysis that allow to identify illegal information in texts. An analytical review of the use of existing language processing tools is conducted, which allows to identify problems of using traditional NLP approaches for the analysis of criminal-significant textual information. The proposed approach is based on the approaches of Information Extraction and focuses on the method of extracting facts from weakly structured texts. The use of technology based on the description of semantic functions by means of algebra of finite predicates is considered, to extract weakly structured facts from sentences of Russian and English. The possibility of using the proposed technology for the analysis of the Kazakh language texts is analyzed.en
dc.identifier.citationЛингвистические инструменты выявления криминально окрашенной текстовой информации веб-контента / О. Ж. Мамырбаев [и др.] // Вестник Казахстанско-Британского университета = Herald of the Kazakh - British Technical University : сб. науч. тр. / гл. ред. К. Н. Ибрашев ; Казах.-Брит. техн. ун-т. – Алматы : КБТУ, 2018. – Т. 15, № 3 (46). – С. 112-117.ru
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/49759
dc.language.isoru
dc.publisherКазахстанско-Британский технический университетru
dc.subjectтерроризмru
dc.subjectмошенничествоru
dc.subjectкиберпреступностьru
dc.subjectалгебра конечных предикатовru
dc.subjectсемантические функцииru
dc.subjectNatural Language Processingen
dc.subjectFacts Extractionen
dc.subjectterrorismen
dc.subjectfrauden
dc.subjectcybercrimeen
dc.subjectalgebra of finite predicatesen
dc.subjectsemantic functionsen
dc.titleЛингвистические инструменты выявления криминально окрашенной текстовой информации веб-контентаru
dc.title.alternativeLinguistic instruments of detecting criminalized text information of Web contenten
dc.typeArticleen

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Ескіз
Назва:
vestnik_KBTU_2018_15_3_Mamyrbaev_Lingvistich_instrumenty.pdf
Розмір:
374.57 KB
Формат:
Adobe Portable Document Format
Опис:

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
11.25 KB
Формат:
Item-specific license agreed upon to submission
Опис: