05.13.06 "Інформаційні технології"
Постійне посилання колекціїhttps://repository.kpi.kharkov.ua/handle/KhPI-Press/17403
Переглянути
Документ Информационная технология экстракции бизнес знаний из текстового контента интегрированной корпоративной системы(НТУ "ХПИ", 2016) Гаутам, Аджит Пратап СингхДиссертация на соискание ученой степени кандидата технических наук по специальности 05.13.06 – информационные технологии. – Национальный технический университет "Харьковский политехнический институт", Харьков, 2016. Цель диссертационного исследования – создание информационной технологии экстракции бизнес знаний интегрированной корпоративной системы на основе информационно-логических моделей и методов смысловой обработки текстового контента. В работе проанализированы существующие информационные технологии, модели и методы экстракции и идентификации знаний из текстов, сформулированы основные требования к разработке информационного обеспечения подсистемы экстракции бизнес знаний из текстового контента интегрированной корпоративной системы. Обосновано использование инструментов алгебры конечных предикатов в информационно-логических моделях экстракции фактов из текстовых потоков; построена математическая модель генерации фактов из текстов корпорации. Результаты диссертационного исследования внедрены в практику разработки и создания подсистем экстракции знаний из текстового контента реальных ИКС. На основе разработанных в диссертационном исследовании методов и моделей интеллектуальной обработки текстового контента предложена информационная технология формирования единого информационного пространства бизнес деятельности корпорации. При этом под информационным пространством интегрированной корпоративной системы понимается совокупность некоторых актуальных сведений, данных, оформленных таким образом, чтобы обеспечивать качество и оперативность принятия решений в области целевой деятельности корпорации. Предложенная информационная технология позволять извлекать знания из всего многообразия информационных ресурсов современного предприятия: Интернет- и интранет- сайтов предприятий и организаций, почтовых сообщений, файловых систем, хранилищ документов различных ведущих производителей, текстовых полей баз данных, репозитариев, различных бизнес-приложений т. п. Технология включает логико-лингвистическую модель генерации фактов из текстовых потоков ИКС, метод структурирования отношений фактов бизнес знаний, метод выявления актуального множества классифицированных сущностей предметной области, а также специализированные этапы Web Content Mining лингвистического процессора. Разработанные в исследовании математические модели могут быть использованы в различных системах автоматической обработки текстов, системах извлечения знаний, экстракции информации (Information Extraction) и распознавания сущностей (Named Entity Recognition).Документ Інформаційна технологія екстракції бізнес знань з текстового контенту інтегрованої корпоративної системи(НТУ "ХПІ", 2016) Гаутам, Аджіт Пратап СінгхДисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – інформаційні технології. – Національний технічний університет "Харківський політехнічний інститут", Харків, 2016. Мета дисертаційного дослідження – створення інформаційної технології екстракції бізнес знань інтегрованої корпоративної системи (ІКС) на основі інформаційно-логічних моделей і методів смислового опрацювання текстового контенту. Основні результати: вперше розроблено логіко-лінгвістичну модель генерації фактів з текстових потоків ІКС, яка базується на використанні поверхневих граматичних характеристик сутностей, предикатів та атрибутів, що до-зволяє ефективно екстрагувати з текстового контенту профільні знання про суб'єкти моніторингу. Отримав подальший розвиток метод компараторної ідентифікації, який використано для структурування відношень фактів бізнес знань ІКС. Реалізація методу дозволила класифікувати атрибути сутностей за класами відношень за рахунок смислової тотожності триплетів фактів, які об'єктивно визначені компаратором. Удосконалено метод виявлення актуальної множини класифікованих сутностей предметної області, який відрізняється комплексним використанням лінгвістичних, статистичних й смислових характеристик в наївному байєсівському класифікаторі. Метод дозволяє класифікувати сутності, що екстрагуються, за апріорно виділеними типами. Удосконалено інформаційну технологію формування єдиного інформаційного простору бізнес діяльності корпорації, яка дозволяє за рахунок використання алгебро-логічних перетворень здійснювати породження складного знання шляхом експліцитного узагальнення інформації, що прихована у сукупності часткових фактів.Документ Інформаційна технологія ідентифікації знань у наукометричних системах на основі інтелектуального аналізу слабоформалізованих даних(НТУ "ХПІ", 2017) Петрасова, Світлана ВалентинівнаДисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – інформаційні технології. – Національний технічний університет "Харківський політехнічний інститут", Харків, 2017. Мета дисертаційного дослідження – підвищення ефективності процесу ідентифікації знань у наукометричних системах за рахунок побудови моделей і методів інтелектуального аналізу слабоформалізованих даних. Основні результати: уперше розроблено логіко-лінгвістичну модель визначення семантично зв'язних фрагментів слабоформалізованої реферативної інформації, яка заснована на використанні алгебро-предикатних операцій, що дозволяє ефективно ідентифікувати знання у реферативній інформації. Удосконалено метод формалізації смислових відношень сутностей, який базується на використанні міри смислової близькості та відрізняється застосуванням інтелектуального аналізу при виявленні класів еквівалентності та толерантності, що дозволяє визначити неявно виражені відношення близькості й відношення таксономії. Отримав по-дальший розвиток метод компараторної ідентифікації, який використано для класифікації смислових фрагментів рефератів у наукометричних системах що дозволяє виділити єдині інформаційні простори наукової взаємодії авторів за рахунок моделювання функцій інтелекту з розуміння та класифікації смислу. Удосконалено інформаційну технологію ідентифікації знань у наукометричних системах, яка дозволяє за рахунок визначення імпліцитних зв'язків між рефератами наукометричних систем динамічно виявляти спільні фронти наукових досліджень. Результати дослідження знайшли практичне застосування у системах обробки анотацій та рефератів. Використання розроблених у роботі моделей і методів дозволило підвищити ефективність процесу ідентифікації знань у слабоформалізованій реферативній інформації за рахунок підвищення значень коефіцієнтів повноти й точності видачі близької за смислом інформації.Документ Інформаційна технологія ідентифікації знань у наукометричних системах на основі інтелектуального аналізу слабоформалізованих даних(НТУ "ХПІ", 2016) Петрасова, Світлана ВалентинівнаДисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 – інформаційні технології. – Національний технічний університет "Харківський політехнічний інститут", Харків, 2017. Мета дисертаційного дослідження – підвищення ефективності процесу ідентифікації знань у наукометричних системах за рахунок побудови моделей і методів інтелектуального аналізу слабоформалізованих даних. Основні результати: уперше розроблено логіко-лінгвістичну модель визначення семантично зв'язних фрагментів слабоформалізованої реферативної інформації, яка заснована на використанні алгебро-предикатних операцій, що дозволяє ефективно ідентифікувати знання у реферативній інформації. Удосконалено метод формалізації смислових відношень сутностей, який базується на використанні міри смислової близькості та відрізняється застосуванням інтелектуального аналізу при виявленні класів еквівалентності та толерантності, що дозволяє визначити неявно виражені відношення близькості й відношення таксономії. Отримав по-дальший розвиток метод компараторної ідентифікації, який використано для класифікації смислових фрагментів рефератів у наукометричних системах що дозволяє виділити єдині інформаційні простори наукової взаємодії авторів за рахунок моделювання функцій інтелекту з розуміння та класифікації смислу. Удосконалено інформаційну технологію ідентифікації знань у наукометричних системах, яка дозволяє за рахунок визначення імпліцитних зв'язків між рефератами наукометричних систем динамічно виявляти спільні фронти наукових досліджень. Результати дослідження знайшли практичне застосування у системах обробки анотацій та рефератів. Використання розроблених у роботі моделей і методів дозволило підвищити ефективність процесу ідентифікації знань у слабоформалізованій реферативній інформації за рахунок підвищення значень коефіцієнтів повноти й точності видачі близької за смислом інформації.