Кафедри

Постійне посилання на розділhttps://repository.kpi.kharkov.ua/handle/KhPI-Press/35393

Переглянути

Результати пошуку

Зараз показуємо 1 - 10 з 15

Використання методів кластеризації текстів в рекомендаційних системах
(Національний технічний університет "Харківський політехнічний інститут", 2020) Мінець, А. А.; Хайрова, Ніна Феліксівна
Визначення смислової близькості текстів при аналізі контенту в рекомендаційних системах
(Національний технічний університет "Харківський політехнічний інститут", 2020) Крученюк, А. Ю.; Хайрова, Ніна Феліксівна
Використання оцінки міри узгодженості при експертному оцінюванні результатів класифікації
(Національний технічний університет "Харківський політехнічний інститут", 2020) Колесник, Анастасія Сергіївна; Хайрова, Ніна Феліксівна
Методичні вказівки до виконання лабораторних робіт з курсу "Корпусна лінгвістика". Частина 2
(ФОП Панов А. М., 2021) Хайрова, Ніна Феліксівна; Петрасова, Світлана Валентинівна; Оробінська, Олена Олександрівна
Поняття корпусної лінгвістики виникло в 80-х роках минулого століття. В даний час під корпусною лінгвістикою розуміється розділ мовознавства, що займається розробкою, створенням і використанням текстових корпусів. Водночас корпусні лінгвістика є швидше не складовою частиною загальної лінгвістики, а являє собою методологію або способи використання конкретних ресурсів, що представляють великі обсяги текстових даних. Отже, корпус та спеціальні програмні засоби роботи з цим корпусом є спеціалізованим інструментом лінгвістичних досліджень. Таке спеціалізоване програмне забезпечення, що використовується для дослідження великих обсягів текстових даних, які зібрані у корпусі, називається concordancer. Традиційно в корпусній лінгвістиці можна виділити два напрями вивчення: створення корпусів і дослідження мовних закономірностей за допомогою корпусних методів на базі створених корпусів. Проте, нерідко розробники корпусів проводять одночасно і власні лінгвістичні дослідження. Таким чином корпусна лінгвістика передбачає одночасне використання лінгвістичних знань та знань комп’ютерних технологій, що і зумовлює використання даної дисципліни в навчальному плані студентів спеціальності "Прикладна та комп'ютерна лінгвістика". Дані методичні рекомендації спрямовані на отримання навичок роботи з усіма складовими корпусних завдань, а саме: створення власних корпусів, опанування різних видів корпусної розмітки, використання Інтернету для корпусних досліджень та вживання різних статистичних методів при роботі з корпусами. В другу частину Методичних вказівок до виконання лабораторних робіт з курсу "Корпусна лінгвістика" включено чотири лабораторні роботи, виконання яких дозволяє отримати навички роботи з системою семантичної розмітки USAS, аналізу корпусу в online середовищі CQPweb та обробки кластерів корпусів конкордансером AntConc.
Методичні вказівки до виконання лабораторних робіт з курсу "Корпусна лінгвістика". Частина 1
(ФОП Панов А. М., 2021) Хайрова, Ніна Феліксівна; Петрасова, Світлана Валентинівна; Оробінська, Олена Олександрівна
Поняття корпусної лінгвістики виникло в 80-х роках минулого століття. В даний час під корпусною лінгвістикою розуміється розділ мовознавства, що займається розробкою, створенням і використанням текстових корпусів. Водночас корпусні лінгвістика є швидше не складовою частиною загальної лінгвістики, а являє собою методологію або способи використання конкретних ресурсів, що представляють великі обсяги текстових даних. Отже, корпус та спеціальні програмні засоби роботи з цим корпусом є спеціалізованим інструментом лінгвістичних досліджень. Таке спеціалізоване програмне забезпечення, що використовується для дослідження великих обсягів текстових даних, які зібрані у корпусі, називається concordancer. Традиційно в корпусній лінгвістиці можна виділити два напрями вивчення: створення корпусів і дослідження мовних закономірностей за допомогою корпусних методів на базі створених корпусів. Проте, нерідко розробники корпусів проводять одночасно і власні лінгвістичні дослідження. Таким чином корпусна лінгвістика передбачає одночасне використання лінгвістичних знань та знань комп’ютерних технологій, що і зумовлює використання даної дисципліни в навчальному плані студентів спеціальності "Прикладна та комп'ютерна лінгвістика". Дані методичні рекомендації спрямовані на отримання навичок роботи з усіма складовими корпусних завдань, а саме: створення власних корпусів, опанування різних видів корпусної розмітки, використання Інтернету для корпусних досліджень та вживання різних статистичних методів при роботі з корпусами. В першу частину Методичних вказівок до виконання лабораторних робіт з курсу "Корпусна лінгвістика" включено три лабораторні роботи, виконання яких дозволяє отримати навички роботи з конкордансером AntConc та системою автоматичного POS-tagging CLAWS.
Технологія визначення інформаційного порядку денного в потоках новинних даних
(Національний технічний університет "Харківський політехнічний інститут", 2021) Петрасова, Світлана Валентинівна; Хайрова, Ніна Феліксівна; Колесник, Анастасія Сергіївна
З кожним днем обсяг потоків новинних даних зростає, що збільшує інтерес до систем, які дозволяють автоматизувати обробку великих потоків даних. Визначення смислової подібності текстової інформації на основі використання інтелектуальних засобів обробки даних дозволить виділяти спільні інформаційні простори новин. У статті проаналізовані сучасні статистичні метрики для визначення зв’язних фрагментів, зокрема, новинних текстів, що відображають порядок денний (agenda), вказані основні переваги та недоліки. Пропонується інформаційна технологія виявлення спільного інформаційного простору актуальних новин в потоці даних за певний період часу. Технологія включає логіко-лінгвістичну і дистрибутивно-статистичну модель ідентифікації колокацій. Модель дистрибутивної семантики МІ застосовується на етапі вилучення потенційних колокацій. При цьому регулярні вирази, розроблені відповідно до граматики англійської мови, дозволяють виявляти граматично правильні конструкції. Перевагою розробленої логіко-лінгвістичної моделі формалізації семантико-граматичних характеристик колокацій на основі використання алгебро-предикатних операцій і предиката семантичної еквівалентності, є врахування аналізу як граматичної структури мови, так і смислу слів (колокатів). Тезаурус WordNet застосовується на етапі визначення відношення синонімії між головними і залежними компонентами колокацій. На основі досліджуваного корпусу новинних текстів служб CNN і BBC проведена оцінка ефективності розробленої технології. Аналіз показав, що коефіцієнт точності precision дорівнює 0,96. Застосування запропонованої технології дозволить поліпшити якість обробки потоків новинних повідомлень. Вирішення завдання автоматичного визначення смислової близькості може застосовуватися при виявленні текстів однієї тематики, актуальної інформації, добуванні фактів і усунення смислової неоднозначності та ін.
Інтелектуальні засоби включення неструктурованої інформації у процес інформаційно-аналітичного забезпечення управління військовою частиною
(Харківський національний університет Повітряних Сил ім. Івана Кожедуба, 2012) Хайрова, Ніна Феліксівна
У статті розглядається необхідність включення неструктурованої інформації у процес інформаційно-аналітичного забезпечення управління військовими частинами, який об'єднує технології Data Mining та Text Mining. Показана необхідність використання технології OLAP-кубів для представлення багатовимірного простору об'єктивних та достовірних знань колекції документів. Запропоновано використання методу компараторної ідентифікації для виділення семантичних ідентифікаторів ієрархії понять колекції. Розроблена технологія створення атрибуту інформаційних понять OLAP-куба колекції.
Використання логіко-алгебраїчної моделі семантичних відмінків для семантичного аналізу речення
(Військовий інститут Київського національного університету ім. Тараса Шевченка, 2012) Хайрова, Ніна Феліксівна
У роботі пропонується логіко-алгебраїчна модель описи семантичних відмінків Філмора. Формально сформульована множина семантико-граматичних ознак дозволяє виділити вісім семантичних відмінків і описати їх через відносини граматичних та семантичних категорій іменників української мови засобами алгебри скінченних предикатів. Показано програмна реалізація моделі в системі українсько-англійського перекладу для зняття перекладної омонімії прийменників, описано алгоритм роботи підсистеми та наведено результати експерименту.
Використання предикатної інтерпретації категорії в якості єдиної мови представлення знань
(Національний технічний університет "Харківський політехнічний інститут" Точка, 2010) Шаронова, Наталія Валеріївна; Тарловський, В. О.; Хайрова, Ніна Феліксівна
Автоматизована побудова семантичної мережі на основі тлумачного словника
(Український мовно-інформаційний фонд Національної академії наук України, 2013) Петрасова, Світлана Валентинівна; Хайрова, Ніна Феліксівна

Кафедри

Переглянути

Фільтри

Налаштування

Сортувати за

Результатів на сторінку

Результати пошуку