Автоматичне видобування колокацій з корпусу текстів

Петрасова, Світлана Валентинівна; Кузьміна, Марія Олександрівна

Автоматичне видобування колокацій з корпусу текстів

Файли

vestnik_KhPI_2018_4_Petrasova_Avtomatychne_vydobuvannia.pdf (472.08 KB)

Дата

2018

Автори

Петрасова, Світлана Валентинівна

Кузьміна, Марія Олександрівна

ORCID

https://orcid.org/ 0000-0001-6011-135X

Видавець

НТУ "ХПІ"

Анотація

У статті розглядається метод автоматичного видобування колокацій з корпусів текстів української мови. Визначено поняття "колокація" з точки зору підходів до його аналізу у сучасній корпусній лінгвістиці. Проаналізовано статистичні методи та існуючі системи, що використовують статистичні міри для видобування колокацій. Описано структуру розробленого корпусу текстів, а також імплементацію статистичної міри МІ для виявлення колокацій з україномовних текстів, що складаються з інструкцій технічної документації.
The article deals with the method for automatic extraction of collocations from the text corpus of the Ukrainian language. Definitions of the term "collocation" have been considered from the viewpoint of approaches to its analysis in modern corpus linguistics. Existing statistical methods and systems that use statistical measures for extraction of collocations have been analyzed, and their features have been described. The corpus of technical documentation has been developed and its structure has been described. To extract collocations from the texts of the Ukrainian language that consist of the instructions of technical documentation, the developed software implementation of MI measure has been described.

Ключові слова

корпусна лінгвістика, статистичні методи, міра MI, технічна документація, corpus linguistics, statistical methods, MI measure

Бібліографічний опис

Петрасова С. B. Автоматичне видобування колокацій з корпусу текстів / С. B. Петрасова, М. О. Кузьміна // Вісник Національного технічного університету "ХПІ". Серія: Актуальні проблеми розвитку українського суспільства = Bulletin of the National Technical University "KhPI". Series: Actual problems of Ukrainian society development : зб. наук. пр. – Харків : НТУ "ХПІ", 2018. – № 4 (1280). – С. 68-72.

URI

https://repository.kpi.kharkov.ua/handle/KhPI-Press/37246

Колекції

Вісник № 04
Кафедра "Інтелектуальні комп'ютерні системи"

Повна інформація про документ
Google Scholar

Автоматичне видобування колокацій з корпусу текстів

Файли

Дата

Автори

ORCID

DOI

Науковий ступінь

Рівень дисертації

Шифр та назва спеціальності

Рада захисту

Установа захисту

Науковий керівник/консультант

Члени комітету

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Опис

Ключові слова

Бібліографічний опис

URI

Колекції

Підтвердження

Рецензія

Додано до

Згадується в