Кафедри
Постійне посилання на розділhttps://repository.kpi.kharkov.ua/handle/KhPI-Press/35393
Переглянути
4 результатів
Результати пошуку
Документ Логико-лингвистическая модель идентификации семантических отношений сущностей средствами алгебры конечных предикатов(Белорусский государственный университет информатики и радиоэлектроники, 2014) Хайрова, Нина Феликсовна; Узлов, Дмитрий Юрьевич; Шаронова, Наталья ВалерьевнаВ работе предлагается логико-лингвистическая модель извлечения слабоструктурированных фактов из естественно языковых текстов. Для идентификации факта в тексте определяются некоторые сущности, выраженные лексическими единицами, и семантические связи между ними. Семантические связи определяются семантическими функциями партиципантов предложения, которые описаны предикатами алгебры конечных предикатов. Модель применяется на семантическом этапе лингвистического процессора информационной подсистемы идентификации криминалистически значимых фактов в слабоструктурированных текстах.Документ Логико-лингвистическая модель генерации фактов из текстовых потоков информационной корпоративной системы(Institute of Information Theories and Applications FOI ITHEA, 2015) Хайрова, Нина Феликсовна; Шаронова, Наталья Валерьевна; Гаутам, Аджит Пратап СингхПодсистема накопления и генерации фактов представляет основу для принятия решений и проведения бизнес-разведки интегрированной корпоративной системы. Причина относительно малого количества систем генерации фактов из слабоструктурированной текстовой информации заключается в отсутствии четких алгоритмов извлечения фактов из текста, проверки их на непротиворечивость и невозможности семантической интерпретации полученных результатов, что не позволяет объединить их в общее единое пространство фактографической информации. В работе предлагается логиколингвистическая модель идентификации и экстракции фактов, позволяющая получить пространство фактов, динамически наполняемое из англоязычного текстового контента интегрированной корпоративной системы. Факт записывается в виде триплета: Subject – Predicate – Object, в котором предикат представляет отношение, а субъект и объект определяют два предмета или понятия. Такой факт записывается в виде двухместного предиката в логике первого порядка. Выделяются два типа фактов: факты, описывающие связь двух сущностей, одна из которых определяется как субъект, а вторая как объект предикатного действия, и факты, фиксирующие значение заранее определенного свойства. Математическая модель, связывающая информацию, содержащуюся в определении смысловых связей, с элементами поверхностной структуры предложений английского языка базируется на формальном аппарате алгебры конечных предикатов. Семантические связи между извлеченными понятиями текста, выражающие тот или иной факт, определяются через предикат, связывающий категории наличия предлога после глагола, существование апострофа, определяющего притяжательный падеж, расположения понятия в предложении, связи которого определяются, наличия глагола to be и формы основного глагола. В статье рассмотрен вид фактов, представляющий утверждение о некотором обладании, приобретении (или наличии) у некоторой сущности субъекта некоторой сущности объекта, и выделены связанные с ним факты второго типа, определяющие атрибут времени, места, способа действия и т. д. Разработана программная имплементация полученной модели, представляющая собой веб-приложение, на вход, которого поступают текстовые потоки разнородных источников информационной системы, а на выходе формируется базовое пространство фактов интегрированной корпоративной системы.Документ Экстракция фактов из слабоструктурированной текстовой информации(Institute of Information Theories and Applications FOI ITHEA, 2016) Хайрова, Нина Феликсовна; Шаронова, Наталья Валерьевна; Гаутам, Аджит Пратап СингхИзвлечение фактов из текстов представляет собой одно из центральных направлений Natural Language Processing. Большинство существующих подходов позволяет извлекать факты из хорошо структурированных текстов узкой тематической направленности, тогда как наибольший интерес представляет возможность автоматизации излечения фактической информации из слабоструктурированных текстов неограниченных предметных областей. Факт, представляющий собой фиксацию некоторого отношения сущностей в предложении, можно записать в виде триплета: Subject – Predicate – Object, в котором предикат представляет отношение, а субъект и объект определяют два предмета или понятия. В работе предлагается строгая модель, связывающая смысловые отношения между сущностями с элементами поверхностной структуры предложений естественного языка. Для формализации и явного представления средствами поверхностной структуры партиципантов триплета факта, называемого предложением английского языка, выделены и описаны предметными переменными конечные множества синтаксических и морфологических категорий. В статье рассмотрены три типа фактов и их атрибутов. Разработана программная имплементация полученной модели, предложена метрика формальной оценки эффективности технологии экстракции фактов из слабоструктурированной текстовой информации и обоснован объем экспериментальной выборки текстов, позволившей подтвердить достоверность полученной точности и полноты извлекаемых фактов.Документ Метод персонификации интеллектуального корпоративного ресурса компании(НТУ "ХПИ", 2009) Шаронова, Наталья Валерьевна; Тарловский, В. А.; Хайрова, Нина ФеликсовнаПроведен анализ существующих проблем представления знаний в современных корпоративных информационных системах. Показана возможность использования математического аппарата алгебры конечных предикатов для моделирования интеллектуальных активов компании. Предложено использование метода компараторной идентификации для разбиения модели знаний предметной области на изменяемые области деятельности менеджера.