Выровненный казахско-русский параллельный корпус, ориентированный на криминальную тематику

dc.contributor.authorХайрова, Нина Феликсовнаru
dc.contributor.authorКолесник, А. С.ru
dc.contributor.authorМамырбаев, Оркен Жумажановичru
dc.contributor.authorМусхина, Куралай Женисбековнаru
dc.date.accessioned2020-12-10T07:25:22Z
dc.date.available2020-12-10T07:25:22Z
dc.date.issued2020
dc.description.abstractВ настоящее время разработка высококачественных параллельных текстовых корпусов является одним из наиболее актуальных и передовых направлений современной лингвистики. Особое внимание уделяется созданию параллельных многоязычных корпусов для языков с низким уровнем ресурсов, таких как казахский язык. В ходе исследования мы исследовали тексты с четырех казахских двуязычных новостных сайтов и создали параллельный казахско-русский корпус текстов, в основе которых лежит криминальная тематика. Для выравнивания корпуса мы использовали набор лексических соответствий и значения POS-тегов обоих языков. 60% наших корпусных предложений автоматически выровнены правильно. Наконец, мы проанализировали факторы, влияющие на процент ошибок.ru
dc.description.abstractCurrently, the development of high-quality parallel textual cases is one of the most relevant and advanced areas of modern linguistics. Particular attention is paid to the creation of parallel multilingual bodies for languages with a low level of resources, such as the Kazakh language. In the course of the study, we examined texts from four Kazakh bilingual news sites and created a parallel Kazakh-Russian corpus of texts based on criminal topics. To align the body, we used a set of lexical correspondences and the meaning of POS tags in both languages. 60% of our package offers are automatically aligned correctly. Finally, we analyzed the factors that influence the percentage of errors.en
dc.identifier.citationВыровненный казахско-русский параллельный корпус, ориентированный на криминальную тематику / Н. Хайрова [и др.] // Алматы энергетика және байланыс университетінің хабаршысы = Вестник Алматинского университета энергетики и связи / гл. ред. В. В. Стояк ; Алмат. ун-т энергетики и связи им. Г. Даукеева. – Алматы, 2020. – № 1 (48). – С. 84-92.ru
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/49737
dc.language.isoru
dc.publisherАлматинский университет энергетики и связи им. Гумарбека Даукееваru
dc.subjectPOS-тегированиеru
dc.subjectлексические соответствияru
dc.subjectсинтаксический анализru
dc.subjectкомпьютерная лингвистикаru
dc.subjectcriminal topicsen
dc.subjectPOS-taggingen
dc.subjectKazakh-Russian parallel corpusen
dc.subjectlexical correspondencesen
dc.titleВыровненный казахско-русский параллельный корпус, ориентированный на криминальную тематикуru
dc.title.alternativeAligned Kazakh-Russian parallel corpus, focused on the crime themeen
dc.typeArticleen

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
vestnik_AUES_2020_1_Khairova_Vyrovnennyi.pdf
Розмір:
595.69 KB
Формат:
Adobe Portable Document Format
Опис:

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
license.txt
Розмір:
11.25 KB
Формат:
Item-specific license agreed upon to submission
Опис: