Кафедри
Постійне посилання на розділhttps://repository.kpi.kharkov.ua/handle/KhPI-Press/35393
Переглянути
13 результатів
Результати пошуку
Документ Построение модели идентификации и систематизации криминально значимой информации в текстовых репозиториях(Херсонський національний технічний університет, 2014) Узлов, Дмитрий Юрьевич; Хайрова, Нина ФеликсовнаДокумент Бинарная логическая сеть извлечения знаний из неструктурированных потоков текстовой информации(Харківський національний університет Повітряних Сил ім. Івана Кожедуба, 2012) Хайрова, Нина ФеликсовнаСформулированы задачи извлечения знаний для пополнения базы знаний корпоративной информацион-ной системы. Предложено использовать математические средства теории интеллекта и наработки ком-пьютерной лингвистики для увеличения семантической силы моделей представления знаний. Разработана математическая модель отношений между локальной областью исследования менеджера и достоверными глубинными знаниями, представленными в документе. Осуществлена графическая реализация предиката персонификации области знаний менеджера в виде логической сети.Документ Логико-лингвистическая модель идентификации семантических отношений сущностей средствами алгебры конечных предикатов(Белорусский государственный университет информатики и радиоэлектроники, 2014) Хайрова, Нина Феликсовна; Узлов, Дмитрий Юрьевич; Шаронова, Наталья ВалерьевнаВ работе предлагается логико-лингвистическая модель извлечения слабоструктурированных фактов из естественно языковых текстов. Для идентификации факта в тексте определяются некоторые сущности, выраженные лексическими единицами, и семантические связи между ними. Семантические связи определяются семантическими функциями партиципантов предложения, которые описаны предикатами алгебры конечных предикатов. Модель применяется на семантическом этапе лингвистического процессора информационной подсистемы идентификации криминалистически значимых фактов в слабоструктурированных текстах.Документ Лингвистические инструменты выявления криминально окрашенной текстовой информации веб-контента(Казахстанско-Британский технический университет, 2018) Мамырбаев, Оркен Жумажанович; Мусхина, Куралай Женисбековна; Хайрова, Нина Феликсовна; Колесник, А. С.В работе рассматриваются виды криминально окрашенной текстовой информации Web-контента (киберпреступность, террористический акт или финансовое мошенничество) и анализируются существующие технологии лингвистического анализа, позволяющие выявлять противоправную информацию в текстах. Проводится аналитический обзор использования существующих инструментов обработки языка, позволяющий выявить проблемы использования традиционных подходов NLP для анализа криминально значимой текстовой информации. Предлагаемый метод базируется на подходах Information Extraction и фокусируется на методе извлечения фактов из cлабоструктурированных текстов. Рассматривается использование технологии, базирующейся на описании семантических функций средствами алгебры конечных предикатов, для извлечения слабоструктурированных фактов из предложений русского и английского языков. Анализируется возможность использования предложенной технологии для текстов казахского языка.Документ Использование интеллектуальных методов идентификации информации в интегрированных информационно-криминалистических системах(Х. Досмұхамедов атындағы Атырау мемлекеттік университеті, 2014) Хайрова, Нина Феликсовна; Узлов, Дмитрий Юрьевич; Борисова, Наталья ВладимировнаДокумент Автоматическая генерация структурированной машинно-читаемой информации из мультиязычных текстов(Институт информационных и вычислительных технологий, Республика Казахстан, 2019) Хайрова, Нина Феликсовна; Мамырбаев, Оркен Жумажанович; Мусхина, Куралай Женисбековна; Колесник, А. С.Open Information Extraction представляет современную стратегию извлечения фактов из коллекций веб-документов. Однако, большая часть современных подходов по извлечению фактов основана на таких, доступных не для всех естественных языков, техниках NLP, как POS-tagging, анализ зависимостей, Named Entity Recognition, Coreference Resolution и др. В этой работе для генерации фактов из текста произвольного веб-контента мы предлагаем использование уравнений алгебры конечных предикатов, выражающих семантические роли участников триплета факта через отношения грамматических и семантических характеристик слов предложения. Модель позволяет извлекать неограниченное количество доменно-независимых фактов из предложений разных языков. В работе показана имплементация модели для английского, казахского и русского языков.Документ Модель извлечения знаний из неструктурированных документов корпоративной информационной системы(Institute of Information Theories and Applications FOI ITHEA, 2011) Хайрова, Нина Феликсовна; Шаронова, Наталья ВалерьевнаВ работе предлагается математическая модель отношений между областью интеллектуальной деятельности менеджера и достоверными глубинными знаниями, представленными в документах, поступающих в корпоративную информационную систему (КИС). Доказывается возможность использования математического аппарата алгебры конечных предикатов в качестве базового средства описания модели. В работе показана возможность использования данной модели для извлечения знаний, представленных терминологическими понятиями и отношениями между ними, из разноформатных текстов документов КИС, с их одновременным динамическим разбиением на персонифицированные локальные области знаний менеджеров корпорации. Описывается информационное и алгоритмическое обеспечение программной реализации модели, приводится расчет эффективности использования разработанной подсистемы.Документ Использование логических сетей для формирования баз знаний логического типа(Херсонський національний технічний університет, 2011) Шаронова, Наталья Валерьевна; Тарловский, Вячеслав Алексеевич; Хайрова, Нина ФеликсовнаДокумент Логико-лингвистическая модель генерации фактов из текстовых потоков информационной корпоративной системы(Institute of Information Theories and Applications FOI ITHEA, 2015) Хайрова, Нина Феликсовна; Шаронова, Наталья Валерьевна; Гаутам, Аджит Пратап СингхПодсистема накопления и генерации фактов представляет основу для принятия решений и проведения бизнес-разведки интегрированной корпоративной системы. Причина относительно малого количества систем генерации фактов из слабоструктурированной текстовой информации заключается в отсутствии четких алгоритмов извлечения фактов из текста, проверки их на непротиворечивость и невозможности семантической интерпретации полученных результатов, что не позволяет объединить их в общее единое пространство фактографической информации. В работе предлагается логиколингвистическая модель идентификации и экстракции фактов, позволяющая получить пространство фактов, динамически наполняемое из англоязычного текстового контента интегрированной корпоративной системы. Факт записывается в виде триплета: Subject – Predicate – Object, в котором предикат представляет отношение, а субъект и объект определяют два предмета или понятия. Такой факт записывается в виде двухместного предиката в логике первого порядка. Выделяются два типа фактов: факты, описывающие связь двух сущностей, одна из которых определяется как субъект, а вторая как объект предикатного действия, и факты, фиксирующие значение заранее определенного свойства. Математическая модель, связывающая информацию, содержащуюся в определении смысловых связей, с элементами поверхностной структуры предложений английского языка базируется на формальном аппарате алгебры конечных предикатов. Семантические связи между извлеченными понятиями текста, выражающие тот или иной факт, определяются через предикат, связывающий категории наличия предлога после глагола, существование апострофа, определяющего притяжательный падеж, расположения понятия в предложении, связи которого определяются, наличия глагола to be и формы основного глагола. В статье рассмотрен вид фактов, представляющий утверждение о некотором обладании, приобретении (или наличии) у некоторой сущности субъекта некоторой сущности объекта, и выделены связанные с ним факты второго типа, определяющие атрибут времени, места, способа действия и т. д. Разработана программная имплементация полученной модели, представляющая собой веб-приложение, на вход, которого поступают текстовые потоки разнородных источников информационной системы, а на выходе формируется базовое пространство фактов интегрированной корпоративной системы.Документ Логико-лингвистическая модель извлечения фактов из слабоструктурированной текстовой информации(Institute of Information Theories and Applications FOI ITHEA, 2013) Хайрова, Нина Феликсовна; Шаронова, Наталья ВалерьевнаОдним из перспективных направлений информационного поиска является фактографический поиск и разработка фактографических баз данных. Существующие сегодня модели и алгоритмы фактографического поиска в своем большинстве направлены на излечение фактов из хорошо формализованной информации, в том числе из хорошо формализованной текстовой информации. В работе предлагается модель извлечения фактографической информации из динамически меняющихся слабоформализованных текстовых потоков, не ограниченных определенными предметными областями. Для извлечения некоторого факта используется шаблон "агент-предикат-значение", отображающий отношения, формально выражаемые семантическими падежами партиципантов предложения. В предлагаемой логико-лингвистической модели семантические роли именных групп определяются отношением четко выделенных множеств морфологических, синтаксических и семантически категорий, описываемым с помощью базового аппарата алгебры конечных предикатов. В работе рассмотрена реализация данной модели для извлечения фактографической информации о дате, месте рождения и роде деятельности персоналии из русскоязычных слабоформалзованных текстов. Экспериментальная проверка программной имплементации модели показала правильность выделения факта примерно в 94,3% случаев.