Кафедра "Інтелектуальні комп'ютерні системи"

Постійне посилання колекціїhttps://repository.kpi.kharkov.ua/handle/KhPI-Press/2423

Офіційний сайт кафедри http://web.kpi.kharkov.ua/iks

Кафедра "Інтелектуальні комп’ютерні системи" заснована 12 лютого 2007 року на базі спеціальності "Прикладна лінгвістика".

У 2009 році на базі кафедри спільно з Українським мовно-інформаційним фондом НАН України було створено Науково-дослідний центр інтелектуальних систем і комп’ютерної лінгвістики.

Кафедра входить до складу Навчально-наукового інституту соціально-гуманітарних технологій Національного технічного університету "Харківський політехнічний інститут".

У складі науково-педагогічного колективу кафедри працюють: 2 доктора технічних наук, 5 кандидатів філологічних наук, 4 кандидата технічних наук, 1 кандидат філософських наук; 2 співробітника мають звання професора, 3 – доцента.

Переглянути

Результати пошуку

Зараз показуємо 1 - 10 з 22
  • Ескіз
    Документ
    Автоматична екстракція термінологічної інформації з англомовних текстів у галузі Software Testing
    (Народна українська академія, 2018) Галкіна, Яна Романівна; Петрасова, Світлана Валентинівна
  • Ескіз
    Документ
    Методичні вказівки до виконання лабораторних робіт з курсу "Корпусна лінгвістика". Частина 2
    (ФОП Панов А. М., 2021) Хайрова, Ніна Феліксівна; Петрасова, Світлана Валентинівна; Оробінська, Олена Олександрівна
    Поняття корпусної лінгвістики виникло в 80-х роках минулого століття. В даний час під корпусною лінгвістикою розуміється розділ мовознавства, що займається розробкою, створенням і використанням текстових корпусів. Водночас корпусні лінгвістика є швидше не складовою частиною загальної лінгвістики, а являє собою методологію або способи використання конкретних ресурсів, що представляють великі обсяги текстових даних. Отже, корпус та спеціальні програмні засоби роботи з цим корпусом є спеціалізованим інструментом лінгвістичних досліджень. Таке спеціалізоване програмне забезпечення, що використовується для дослідження великих обсягів текстових даних, які зібрані у корпусі, називається concordancer. Традиційно в корпусній лінгвістиці можна виділити два напрями вивчення: створення корпусів і дослідження мовних закономірностей за допомогою корпусних методів на базі створених корпусів. Проте, нерідко розробники корпусів проводять одночасно і власні лінгвістичні дослідження. Таким чином корпусна лінгвістика передбачає одночасне використання лінгвістичних знань та знань комп’ютерних технологій, що і зумовлює використання даної дисципліни в навчальному плані студентів спеціальності "Прикладна та комп'ютерна лінгвістика". Дані методичні рекомендації спрямовані на отримання навичок роботи з усіма складовими корпусних завдань, а саме: створення власних корпусів, опанування різних видів корпусної розмітки, використання Інтернету для корпусних досліджень та вживання різних статистичних методів при роботі з корпусами. В другу частину Методичних вказівок до виконання лабораторних робіт з курсу "Корпусна лінгвістика" включено чотири лабораторні роботи, виконання яких дозволяє отримати навички роботи з системою семантичної розмітки USAS, аналізу корпусу в online середовищі CQPweb та обробки кластерів корпусів конкордансером AntConc.
  • Ескіз
    Документ
    Методичні вказівки до виконання лабораторних робіт з курсу "Корпусна лінгвістика". Частина 1
    (ФОП Панов А. М., 2021) Хайрова, Ніна Феліксівна; Петрасова, Світлана Валентинівна; Оробінська, Олена Олександрівна
    Поняття корпусної лінгвістики виникло в 80-х роках минулого століття. В даний час під корпусною лінгвістикою розуміється розділ мовознавства, що займається розробкою, створенням і використанням текстових корпусів. Водночас корпусні лінгвістика є швидше не складовою частиною загальної лінгвістики, а являє собою методологію або способи використання конкретних ресурсів, що представляють великі обсяги текстових даних. Отже, корпус та спеціальні програмні засоби роботи з цим корпусом є спеціалізованим інструментом лінгвістичних досліджень. Таке спеціалізоване програмне забезпечення, що використовується для дослідження великих обсягів текстових даних, які зібрані у корпусі, називається concordancer. Традиційно в корпусній лінгвістиці можна виділити два напрями вивчення: створення корпусів і дослідження мовних закономірностей за допомогою корпусних методів на базі створених корпусів. Проте, нерідко розробники корпусів проводять одночасно і власні лінгвістичні дослідження. Таким чином корпусна лінгвістика передбачає одночасне використання лінгвістичних знань та знань комп’ютерних технологій, що і зумовлює використання даної дисципліни в навчальному плані студентів спеціальності "Прикладна та комп'ютерна лінгвістика". Дані методичні рекомендації спрямовані на отримання навичок роботи з усіма складовими корпусних завдань, а саме: створення власних корпусів, опанування різних видів корпусної розмітки, використання Інтернету для корпусних досліджень та вживання різних статистичних методів при роботі з корпусами. В першу частину Методичних вказівок до виконання лабораторних робіт з курсу "Корпусна лінгвістика" включено три лабораторні роботи, виконання яких дозволяє отримати навички роботи з конкордансером AntConc та системою автоматичного POS-tagging CLAWS.
  • Ескіз
    Документ
    Технологія визначення інформаційного порядку денного в потоках новинних даних
    (Національний технічний університет "Харківський політехнічний інститут", 2021) Петрасова, Світлана Валентинівна; Хайрова, Ніна Феліксівна; Колесник, Анастасія Сергіївна
    З кожним днем обсяг потоків новинних даних зростає, що збільшує інтерес до систем, які дозволяють автоматизувати обробку великих потоків даних. Визначення смислової подібності текстової інформації на основі використання інтелектуальних засобів обробки даних дозволить виділяти спільні інформаційні простори новин. У статті проаналізовані сучасні статистичні метрики для визначення зв’язних фрагментів, зокрема, новинних текстів, що відображають порядок денний (agenda), вказані основні переваги та недоліки. Пропонується інформаційна технологія виявлення спільного інформаційного простору актуальних новин в потоці даних за певний період часу. Технологія включає логіко-лінгвістичну і дистрибутивно-статистичну модель ідентифікації колокацій. Модель дистрибутивної семантики МІ застосовується на етапі вилучення потенційних колокацій. При цьому регулярні вирази, розроблені відповідно до граматики англійської мови, дозволяють виявляти граматично правильні конструкції. Перевагою розробленої логіко-лінгвістичної моделі формалізації семантико-граматичних характеристик колокацій на основі використання алгебро-предикатних операцій і предиката семантичної еквівалентності, є врахування аналізу як граматичної структури мови, так і смислу слів (колокатів). Тезаурус WordNet застосовується на етапі визначення відношення синонімії між головними і залежними компонентами колокацій. На основі досліджуваного корпусу новинних текстів служб CNN і BBC проведена оцінка ефективності розробленої технології. Аналіз показав, що коефіцієнт точності precision дорівнює 0,96. Застосування запропонованої технології дозволить поліпшити якість обробки потоків новинних повідомлень. Вирішення завдання автоматичного визначення смислової близькості може застосовуватися при виявленні текстів однієї тематики, актуальної інформації, добуванні фактів і усунення смислової неоднозначності та ін.
  • Ескіз
    Документ
    Метод автоматичного визначення семантично близьких фрагментів новинних текстів
    (Національний технічний університет "Харківський політехнічний інститут", 2019) Петрасова, Світлана Валентинівна; Галкіна, Яна Романівна; Мануйлов, Ілля Олександрович; Бородіна, Олександра Русланівна; Швець, Софія Ігорівна
    Складність семантичного аналізу текстової інформації, що міститься в новинних повідомленнях, визначається багатозначністю і синонімічністю, які властиві мові на всіх рівнях її представлення, що, перш за все, впливає на визначення смислово ї близькості мовних одиниць. Виявлення семантично близьких фрагментів текстів або перефразувань є актуальною проблемою у таких наукових напрямках як семантичний пошук інформації, видобування інформації, машинний переклад, визначення порушень авторських прав і т.п. , крім того широко використовується при рерайтингу. У статті проаналізовано основні проблеми рерайтинга, зокрема перефразування синтаксичних одиниць тексту зі збереженням смислового навантаження. Розглянуто сучасні методи визначення семантичної близькості слів, вказано основні переваги та недоліки. Запропоновано метод автоматичного виявлення синонімічних фрагментів новинних текстів на основі використання WordNet та розроблених синтаксичних правил, які зберігають інформацію про граматичні характеристики слів. Перевагою даного методу є те, що аналізується як граматична структура мови, так і смисл слів. Досліджуваний корпус представлено новинними текстами інформаційного агентства Reuters, служб CNN і BBC World News. Запропонований метод ідентифікації семантично зв’язних фрагментів тексту дозволяє виявити спільний інформаційний простір актуальних новин та може використовуватися для ефективного визначення близьких за змістом текстів в інформаційно-пошукових, експертних, аналітичних інформаційних системах. Вирішення завдання автоматичного визначення семантичної близькості може застосовуватися при автоматизованій побудові онтологій по тексту, для розширення існуючих і створення нових тезаурусів.
  • Ескіз
    Документ
    Автоматизована побудова семантичної мережі на основі тлумачного словника
    (Український мовно-інформаційний фонд Національної академії наук України, 2013) Петрасова, Світлана Валентинівна; Хайрова, Ніна Феліксівна
  • Ескіз
    Документ
    Методичні вказівки до виконання випускної кваліфікаційної роботи бакалавра та магістра
    (ФЛ-П Черняк Л. О., 2018) Хайрова, Ніна Феліксівна; Петрасова, Світлана Валентинівна; Угольнікова, Наталія Сергіївна
    Методичні вказівки призначені для надання необхідної методичної допомоги при виконанні та оформленні випускних кваліфікаційних робіт студентами, що навчаються за спеціальністю "Прикладна та комп’ютерна лінгвістика" на кафедрі інтелектуальних комп’ютерних систем Національного технічного університету "Харківський політехнічний інститут".
  • Ескіз
    Документ
    Інтелектуалізація сучасного інформаційного простору
    (Національний технічний університет "Харківський політехнічний інститут", 2016) Петрасова, Світлана Валентинівна; Хайрова, Ніна Феліксівна
  • Ескіз
    Документ
    Автоматичне визначення інтернет-сленгу в неформальному інформаційному просторі
    (Національний технічний університет "Харківський політехнічний інститут", 2018) Петрасова, Світлана Валентинівна; Бородіна, О. Р.
  • Ескіз
    Документ
    Аналіз проблеми автоматичного виявлення перефразувань в області завдань Natural Language Processing
    (Національний технічний університет "Харківський політехнічний інститут", 2019) Петрасова, Світлана Валентинівна