Кафедри
Постійне посилання на розділhttps://repository.kpi.kharkov.ua/handle/KhPI-Press/35393
Переглянути
1 результатів
Результати пошуку
Документ Лингвистические инструменты выявления криминально окрашенной текстовой информации веб-контента(Казахстанско-Британский технический университет, 2018) Мамырбаев, Оркен Жумажанович; Мусхина, Куралай Женисбековна; Хайрова, Нина Феликсовна; Колесник, А. С.В работе рассматриваются виды криминально окрашенной текстовой информации Web-контента (киберпреступность, террористический акт или финансовое мошенничество) и анализируются существующие технологии лингвистического анализа, позволяющие выявлять противоправную информацию в текстах. Проводится аналитический обзор использования существующих инструментов обработки языка, позволяющий выявить проблемы использования традиционных подходов NLP для анализа криминально значимой текстовой информации. Предлагаемый метод базируется на подходах Information Extraction и фокусируется на методе извлечения фактов из cлабоструктурированных текстов. Рассматривается использование технологии, базирующейся на описании семантических функций средствами алгебры конечных предикатов, для извлечения слабоструктурированных фактов из предложений русского и английского языков. Анализируется возможность использования предложенной технологии для текстов казахского языка.