Логико-лингвистическая модель извлечения фактов из слабоструктурированной текстовой информации

dc.contributor.authorХайрова, Нина Феликсовнаru
dc.contributor.authorШаронова, Наталья Валерьевнаru
dc.date.accessioned2020-08-10T11:28:08Z
dc.date.available2020-08-10T11:28:08Z
dc.date.issued2013
dc.description.abstractОдним из перспективных направлений информационного поиска является фактографический поиск и разработка фактографических баз данных. Существующие сегодня модели и алгоритмы фактографического поиска в своем большинстве направлены на излечение фактов из хорошо формализованной информации, в том числе из хорошо формализованной текстовой информации. В работе предлагается модель извлечения фактографической информации из динамически меняющихся слабоформализованных текстовых потоков, не ограниченных определенными предметными областями. Для извлечения некоторого факта используется шаблон "агент-предикат-значение", отображающий отношения, формально выражаемые семантическими падежами партиципантов предложения. В предлагаемой логико-лингвистической модели семантические роли именных групп определяются отношением четко выделенных множеств морфологических, синтаксических и семантически категорий, описываемым с помощью базового аппарата алгебры конечных предикатов. В работе рассмотрена реализация данной модели для извлечения фактографической информации о дате, месте рождения и роде деятельности персоналии из русскоязычных слабоформалзованных текстов. Экспериментальная проверка программной имплементации модели показала правильность выделения факта примерно в 94,3% случаев.ru
dc.identifier.citationХайрова Н. Логико-лингвистическая модель извлечения фактов из слабоструктурированной текстовой информации / Н. Хайрова, Н. Шаронова // Information Models and Analyses. – 2013. – Vol. 2, № 2. – P. 167-175.ru
dc.identifier.urihttps://repository.kpi.kharkov.ua/handle/KhPI-Press/47697
dc.language.isoru
dc.publisherInstitute of Information Theories and Applications FOI ITHEAen
dc.subjectпоиск фактографическийru
dc.subjectпроцессор лингвистическийru
dc.subjectалгебра конечных предикатовru
dc.subjectизвлечение информацииru
dc.titleЛогико-лингвистическая модель извлечения фактов из слабоструктурированной текстовой информацииru
dc.typeArticleen

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Ескіз
Назва:
IJ_IMA_2013_2_2_Khairova_Lohyko-lynhvystych_model.pdf
Розмір:
340.21 KB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
11.25 KB
Формат:
Item-specific license agreed upon to submission
Опис: