Лингвистические инструменты выявления криминально окрашенной текстовой информации веб-контента
dc.contributor.author | Мамырбаев, Оркен Жумажанович | ru |
dc.contributor.author | Мусхина, Куралай Женисбековна | ru |
dc.contributor.author | Хайрова, Нина Феликсовна | ru |
dc.contributor.author | Колесник, А. С. | ru |
dc.date.accessioned | 2020-12-11T09:02:23Z | |
dc.date.available | 2020-12-11T09:02:23Z | |
dc.date.issued | 2018 | |
dc.description.abstract | В работе рассматриваются виды криминально окрашенной текстовой информации Web-контента (киберпреступность, террористический акт или финансовое мошенничество) и анализируются существующие технологии лингвистического анализа, позволяющие выявлять противоправную информацию в текстах. Проводится аналитический обзор использования существующих инструментов обработки языка, позволяющий выявить проблемы использования традиционных подходов NLP для анализа криминально значимой текстовой информации. Предлагаемый метод базируется на подходах Information Extraction и фокусируется на методе извлечения фактов из cлабоструктурированных текстов. Рассматривается использование технологии, базирующейся на описании семантических функций средствами алгебры конечных предикатов, для извлечения слабоструктурированных фактов из предложений русского и английского языков. Анализируется возможность использования предложенной технологии для текстов казахского языка. | ru |
dc.description.abstract | The paper deals with types of criminally colored textual information of Web content (cybercrime, terrorist act or financial fraud) and analyzes existing technologies of linguistic analysis that allow to identify illegal information in texts. An analytical review of the use of existing language processing tools is conducted, which allows to identify problems of using traditional NLP approaches for the analysis of criminal-significant textual information. The proposed approach is based on the approaches of Information Extraction and focuses on the method of extracting facts from weakly structured texts. The use of technology based on the description of semantic functions by means of algebra of finite predicates is considered, to extract weakly structured facts from sentences of Russian and English. The possibility of using the proposed technology for the analysis of the Kazakh language texts is analyzed. | en |
dc.identifier.citation | Лингвистические инструменты выявления криминально окрашенной текстовой информации веб-контента / О. Ж. Мамырбаев [и др.] // Вестник Казахстанско-Британского университета = Herald of the Kazakh - British Technical University : сб. науч. тр. / гл. ред. К. Н. Ибрашев ; Казах.-Брит. техн. ун-т. – Алматы : КБТУ, 2018. – Т. 15, № 3 (46). – С. 112-117. | ru |
dc.identifier.uri | https://repository.kpi.kharkov.ua/handle/KhPI-Press/49759 | |
dc.language.iso | ru | |
dc.publisher | Казахстанско-Британский технический университет | ru |
dc.subject | терроризм | ru |
dc.subject | мошенничество | ru |
dc.subject | киберпреступность | ru |
dc.subject | алгебра конечных предикатов | ru |
dc.subject | семантические функции | ru |
dc.subject | Natural Language Processing | en |
dc.subject | Facts Extraction | en |
dc.subject | terrorism | en |
dc.subject | fraud | en |
dc.subject | cybercrime | en |
dc.subject | algebra of finite predicates | en |
dc.subject | semantic functions | en |
dc.title | Лингвистические инструменты выявления криминально окрашенной текстовой информации веб-контента | ru |
dc.title.alternative | Linguistic instruments of detecting criminalized text information of Web content | en |
dc.type | Article | en |
Файли
Контейнер файлів
1 - 1 з 1
- Назва:
- vestnik_KBTU_2018_15_3_Mamyrbaev_Lingvistich_instrumenty.pdf
- Розмір:
- 374.57 KB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 11.25 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: