Автоматическая генерация структурированной машинно-читаемой информации из мультиязычных текстов
dc.contributor.author | Хайрова, Нина Феликсовна | ru |
dc.contributor.author | Мамырбаев, Оркен Жумажанович | ru |
dc.contributor.author | Мусхина, Куралай Женисбековна | ru |
dc.contributor.author | Колесник, А. С. | ru |
dc.date.accessioned | 2020-12-09T13:25:14Z | |
dc.date.available | 2020-12-09T13:25:14Z | |
dc.date.issued | 2019 | |
dc.description.abstract | Open Information Extraction представляет современную стратегию извлечения фактов из коллекций веб-документов. Однако, большая часть современных подходов по извлечению фактов основана на таких, доступных не для всех естественных языков, техниках NLP, как POS-tagging, анализ зависимостей, Named Entity Recognition, Coreference Resolution и др. В этой работе для генерации фактов из текста произвольного веб-контента мы предлагаем использование уравнений алгебры конечных предикатов, выражающих семантические роли участников триплета факта через отношения грамматических и семантических характеристик слов предложения. Модель позволяет извлекать неограниченное количество доменно-независимых фактов из предложений разных языков. В работе показана имплементация модели для английского, казахского и русского языков. | ru |
dc.identifier.citation | Автоматическая генерация структурированной машинно-читаемой информации из мультиязычных текстов / Н. Ф. Хайрова [и др.] // Информатика и прикладная математика : материалы 4-й междунар. науч.-практ. конф., посвящ. 70-летнему юбилею проф. Т. Н. Биярова, В. Вуйцика и 60-летию проф. Е. Н. Амиргалиева, 25-29 сентября 2019 г., Казахстан : в 2 ч. Ч. 2 / гл. ред. М. Н. Калимолдаев ; Ин-т информ. и вычислит. технологий МОН РК. – Алматы, 2019. – С. 509-519. | ru |
dc.identifier.uri | https://repository.kpi.kharkov.ua/handle/KhPI-Press/49733 | |
dc.language.iso | ru | |
dc.publisher | Институт информационных и вычислительных технологий, Республика Казахстан | ru |
dc.subject | Open Information Extraction | en |
dc.subject | доменно-независимые факты | ru |
dc.subject | извлечение | ru |
dc.subject | логико-лингвистическая модель | ru |
dc.subject | алгебра конечных предикатов | ru |
dc.title | Автоматическая генерация структурированной машинно-читаемой информации из мультиязычных текстов | ru |
dc.type | Thesis | en |
Файли
Контейнер файлів
1 - 1 з 1
- Назва:
- Khairova_Avtomaticheskaia_generatciia_2019.pdf
- Розмір:
- 520.69 KB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 11.25 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: