Автоматическая генерация структурированной машинно-читаемой информации из мультиязычных текстов

dc.contributor.authorХайрова, Нина Феликсовнаru
dc.contributor.authorМамырбаев, Оркен Жумажановичru
dc.contributor.authorМусхина, Куралай Женисбековнаru
dc.contributor.authorКолесник, А. С.ru
dc.date.accessioned2020-12-09T13:25:14Z
dc.date.available2020-12-09T13:25:14Z
dc.date.issued2019
dc.description.abstractOpen Information Extraction представляет современную стратегию извлечения фактов из коллекций веб-документов. Однако, большая часть современных подходов по извлечению фактов основана на таких, доступных не для всех естественных языков, техниках NLP, как POS-tagging, анализ зависимостей, Named Entity Recognition, Coreference Resolution и др. В этой работе для генерации фактов из текста произвольного веб-контента мы предлагаем использование уравнений алгебры конечных предикатов, выражающих семантические роли участников триплета факта через отношения грамматических и семантических характеристик слов предложения. Модель позволяет извлекать неограниченное количество доменно-независимых фактов из предложений разных языков. В работе показана имплементация модели для английского, казахского и русского языков.ru
dc.identifier.citationАвтоматическая генерация структурированной машинно-читаемой информации из мультиязычных текстов / Н. Ф. Хайрова [и др.] // Информатика и прикладная математика : материалы 4-й междунар. науч.-практ. конф., посвящ. 70-летнему юбилею проф. Т. Н. Биярова, В. Вуйцика и 60-летию проф. Е. Н. Амиргалиева, 25-29 сентября 2019 г., Казахстан : в 2 ч. Ч. 2 / гл. ред. М. Н. Калимолдаев ; Ин-т информ. и вычислит. технологий МОН РК. – Алматы, 2019. – С. 509-519.ru
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/49733
dc.language.isoru
dc.publisherИнститут информационных и вычислительных технологий, Республика Казахстанru
dc.subjectOpen Information Extractionen
dc.subjectдоменно-независимые фактыru
dc.subjectизвлечениеru
dc.subjectлогико-лингвистическая модельru
dc.subjectалгебра конечных предикатовru
dc.titleАвтоматическая генерация структурированной машинно-читаемой информации из мультиязычных текстовru
dc.typeThesisen

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Ескіз
Назва:
Khairova_Avtomaticheskaia_generatciia_2019.pdf
Розмір:
520.69 KB
Формат:
Adobe Portable Document Format
Опис:

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
11.25 KB
Формат:
Item-specific license agreed upon to submission
Опис: