05.13.06 "Інформаційні технології"
Постійне посилання зібрання
Переглянути
Перегляд 05.13.06 "Інформаційні технології" за Автор "Гаутам, Аджит Пратап Сингх"
Зараз показуємо 1 - 1 з 1
Результатів на сторінці
Налаштування сортування
Документ Информационная технология экстракции бизнес знаний из текстового контента интегрированной корпоративной системы(НТУ "ХПИ", 2016) Гаутам, Аджит Пратап СингхДиссертация на соискание ученой степени кандидата технических наук по специальности 05.13.06 – информационные технологии. – Национальный технический университет "Харьковский политехнический институт", Харьков, 2016. Цель диссертационного исследования – создание информационной технологии экстракции бизнес знаний интегрированной корпоративной системы на основе информационно-логических моделей и методов смысловой обработки текстового контента. В работе проанализированы существующие информационные технологии, модели и методы экстракции и идентификации знаний из текстов, сформулированы основные требования к разработке информационного обеспечения подсистемы экстракции бизнес знаний из текстового контента интегрированной корпоративной системы. Обосновано использование инструментов алгебры конечных предикатов в информационно-логических моделях экстракции фактов из текстовых потоков; построена математическая модель генерации фактов из текстов корпорации. Результаты диссертационного исследования внедрены в практику разработки и создания подсистем экстракции знаний из текстового контента реальных ИКС. На основе разработанных в диссертационном исследовании методов и моделей интеллектуальной обработки текстового контента предложена информационная технология формирования единого информационного пространства бизнес деятельности корпорации. При этом под информационным пространством интегрированной корпоративной системы понимается совокупность некоторых актуальных сведений, данных, оформленных таким образом, чтобы обеспечивать качество и оперативность принятия решений в области целевой деятельности корпорации. Предложенная информационная технология позволять извлекать знания из всего многообразия информационных ресурсов современного предприятия: Интернет- и интранет- сайтов предприятий и организаций, почтовых сообщений, файловых систем, хранилищ документов различных ведущих производителей, текстовых полей баз данных, репозитариев, различных бизнес-приложений т. п. Технология включает логико-лингвистическую модель генерации фактов из текстовых потоков ИКС, метод структурирования отношений фактов бизнес знаний, метод выявления актуального множества классифицированных сущностей предметной области, а также специализированные этапы Web Content Mining лингвистического процессора. Разработанные в исследовании математические модели могут быть использованы в различных системах автоматической обработки текстов, системах извлечения знаний, экстракции информации (Information Extraction) и распознавания сущностей (Named Entity Recognition).