Кафедра "Інтелектуальні комп'ютерні системи"
Постійне посилання колекціїhttps://repository.kpi.kharkov.ua/handle/KhPI-Press/2423
Офіційний сайт кафедри http://web.kpi.kharkov.ua/iks
Кафедра "Інтелектуальні комп’ютерні системи" заснована 12 лютого 2007 року на базі спеціальності "Прикладна лінгвістика".
У 2009 році на базі кафедри спільно з Українським мовно-інформаційним фондом НАН України було створено Науково-дослідний центр інтелектуальних систем і комп’ютерної лінгвістики.
Кафедра входить до складу Навчально-наукового інституту соціально-гуманітарних технологій Національного технічного університету "Харківський політехнічний інститут".
У складі науково-педагогічного колективу кафедри працюють: 2 доктора технічних наук, 5 кандидатів філологічних наук, 4 кандидата технічних наук, 1 кандидат філософських наук; 2 співробітника мають звання професора, 3 – доцента.
Переглянути
Документ Идентификация смысловой близости фрагментов текстов наукометрических баз(ITHEA, Bulgaria, 2018) Петрасова, Светлана Валентиновна; Хайрова, Нина Феликсовна; Киселева, В.Сложность анализа текстовой информации, содержащейся в наукометрических системам, определяется многозначностью и синонимичностью, которые свойственны языку на всех уровнях его представления, что, прежде всего, влияет на определение смыслового единства языковых единиц. При этом решение задачи усложняется, если речь идет о смысловой близости крупных информационных фрагментов. Поэтому в связи со стремительным ростом объемов информационных ресурсов в наукометрических системах и существующими подходами и методами анализа слабоформализованных данных становятся перспективными задачи обработки текстовой информации на базе интеллектуального анализа. В работе рассматривается информационная технология идентификации смысловой близости фрагментов текстов наукометрических систем. Предложенная технология позволяет определять общие информационные пространства научного взаимодействия авторов за счет идентификации семантически эквивалентных коллокаций в текстах. Технология включает модель формального описания семантико-грамматических характеристик слов атрибутивных, глагольных и субстантивных коллокаций и определение предиката семантической эквивалентности двухсловных коллокаций на основе уравнений алгебры конечных предикатов. Программная имплементация модели представляет собой веб-приложение, определяющее семантически близкие текстовые фрагменты статей, индексируемых в наукометрических базах Google Scholar и Science Direct. В результате определяется эвристическая оценка эффективности разработанной технологии для каждого типа коллокаций.Документ Лингвистические инструменты выявления криминально окрашенной текстовой информации веб-контента(Казахстанско-Британский технический университет, 2018) Мамырбаев, Оркен Жумажанович; Мусхина, Куралай Женисбековна; Хайрова, Нина Феликсовна; Колесник, А. С.В работе рассматриваются виды криминально окрашенной текстовой информации Web-контента (киберпреступность, террористический акт или финансовое мошенничество) и анализируются существующие технологии лингвистического анализа, позволяющие выявлять противоправную информацию в текстах. Проводится аналитический обзор использования существующих инструментов обработки языка, позволяющий выявить проблемы использования традиционных подходов NLP для анализа криминально значимой текстовой информации. Предлагаемый метод базируется на подходах Information Extraction и фокусируется на методе извлечения фактов из cлабоструктурированных текстов. Рассматривается использование технологии, базирующейся на описании семантических функций средствами алгебры конечных предикатов, для извлечения слабоструктурированных фактов из предложений русского и английского языков. Анализируется возможность использования предложенной технологии для текстов казахского языка.Документ Логико-лингвистическая модель генерации фактов из текстовых потоков информационной корпоративной системы(Institute of Information Theories and Applications FOI ITHEA, 2015) Хайрова, Нина Феликсовна; Шаронова, Наталья Валерьевна; Гаутам, Аджит Пратап СингхПодсистема накопления и генерации фактов представляет основу для принятия решений и проведения бизнес-разведки интегрированной корпоративной системы. Причина относительно малого количества систем генерации фактов из слабоструктурированной текстовой информации заключается в отсутствии четких алгоритмов извлечения фактов из текста, проверки их на непротиворечивость и невозможности семантической интерпретации полученных результатов, что не позволяет объединить их в общее единое пространство фактографической информации. В работе предлагается логиколингвистическая модель идентификации и экстракции фактов, позволяющая получить пространство фактов, динамически наполняемое из англоязычного текстового контента интегрированной корпоративной системы. Факт записывается в виде триплета: Subject – Predicate – Object, в котором предикат представляет отношение, а субъект и объект определяют два предмета или понятия. Такой факт записывается в виде двухместного предиката в логике первого порядка. Выделяются два типа фактов: факты, описывающие связь двух сущностей, одна из которых определяется как субъект, а вторая как объект предикатного действия, и факты, фиксирующие значение заранее определенного свойства. Математическая модель, связывающая информацию, содержащуюся в определении смысловых связей, с элементами поверхностной структуры предложений английского языка базируется на формальном аппарате алгебры конечных предикатов. Семантические связи между извлеченными понятиями текста, выражающие тот или иной факт, определяются через предикат, связывающий категории наличия предлога после глагола, существование апострофа, определяющего притяжательный падеж, расположения понятия в предложении, связи которого определяются, наличия глагола to be и формы основного глагола. В статье рассмотрен вид фактов, представляющий утверждение о некотором обладании, приобретении (или наличии) у некоторой сущности субъекта некоторой сущности объекта, и выделены связанные с ним факты второго типа, определяющие атрибут времени, места, способа действия и т. д. Разработана программная имплементация полученной модели, представляющая собой веб-приложение, на вход, которого поступают текстовые потоки разнородных источников информационной системы, а на выходе формируется базовое пространство фактов интегрированной корпоративной системы.Документ Логико-лингвистическая модель идентификации семантических отношений сущностей средствами алгебры конечных предикатов(Белорусский государственный университет информатики и радиоэлектроники, 2014) Хайрова, Нина Феликсовна; Узлов, Дмитрий Юрьевич; Шаронова, Наталья ВалерьевнаВ работе предлагается логико-лингвистическая модель извлечения слабоструктурированных фактов из естественно языковых текстов. Для идентификации факта в тексте определяются некоторые сущности, выраженные лексическими единицами, и семантические связи между ними. Семантические связи определяются семантическими функциями партиципантов предложения, которые описаны предикатами алгебры конечных предикатов. Модель применяется на семантическом этапе лингвистического процессора информационной подсистемы идентификации криминалистически значимых фактов в слабоструктурированных текстах.Документ Метод персонификации интеллектуального корпоративного ресурса компании(НТУ "ХПИ", 2009) Шаронова, Наталья Валерьевна; Тарловский, В. А.; Хайрова, Нина ФеликсовнаПроведен анализ существующих проблем представления знаний в современных корпоративных информационных системах. Показана возможность использования математического аппарата алгебры конечных предикатов для моделирования интеллектуальных активов компании. Предложено использование метода компараторной идентификации для разбиения модели знаний предметной области на изменяемые области деятельности менеджера.Документ Экстракция фактов из слабоструктурированной текстовой информации(Institute of Information Theories and Applications FOI ITHEA, 2016) Хайрова, Нина Феликсовна; Шаронова, Наталья Валерьевна; Гаутам, Аджит Пратап СингхИзвлечение фактов из текстов представляет собой одно из центральных направлений Natural Language Processing. Большинство существующих подходов позволяет извлекать факты из хорошо структурированных текстов узкой тематической направленности, тогда как наибольший интерес представляет возможность автоматизации излечения фактической информации из слабоструктурированных текстов неограниченных предметных областей. Факт, представляющий собой фиксацию некоторого отношения сущностей в предложении, можно записать в виде триплета: Subject – Predicate – Object, в котором предикат представляет отношение, а субъект и объект определяют два предмета или понятия. В работе предлагается строгая модель, связывающая смысловые отношения между сущностями с элементами поверхностной структуры предложений естественного языка. Для формализации и явного представления средствами поверхностной структуры партиципантов триплета факта, называемого предложением английского языка, выделены и описаны предметными переменными конечные множества синтаксических и морфологических категорий. В статье рассмотрены три типа фактов и их атрибутов. Разработана программная имплементация полученной модели, предложена метрика формальной оценки эффективности технологии экстракции фактов из слабоструктурированной текстовой информации и обоснован объем экспериментальной выборки текстов, позволившей подтвердить достоверность полученной точности и полноты извлекаемых фактов.