Research application of the spam filtering and spammer detection algorithms on social media and messengers
Дата
2023
DOI
doi.org/10.20998/2522-9052.2023.3.09
Науковий ступінь
Рівень дисертації
Шифр та назва спеціальності
Рада захисту
Установа захисту
Науковий керівник
Члени комітету
Назва журналу
Номер ISSN
Назва тому
Видавець
Національний технічний університет "Харківський політехнічний інститут"
Анотація
In the current era, numerous social networks and messaging platforms have become integral parts of our lives, particularly in relation to work activities, due to the prevailing COVID-19 pandemic and russian war in Ukraine. Amidst this backdrop, the issue of spam and spammers has become more pertinent than ever, with a continuous rise in the incidence of spam within work-related text streams. Spam refers to textual content that is extraneous to a specific text stream, while a spammer denotes an individual who disseminates unsolicited messages for personal gain. The proposed article is devoted to address this scientific and practical challenge of identifying spammers and detecting spam messages within the textual context of any social network or messenger. This endeavor encompasses the utilization of diverse spam detection algorithms and approaches for spammer identification. Four algorithms were implemented, namely a naive Bayesian classifier, Support-vector machine, multilayer perceptron neural network, and convolutional neural network. The research objective was to develop a spam detection algorithm that can be seamlessly integrated into a messenger platform, exemplified by the utilization of Telegram as a case study. The designed algorithm discerns spam based on the contextual characteristics of a specific text stream, subsequently removing the spam message and blocking the spammeruser until authorized by one of the application administrators.
Сьогодні існує багато різних соціальних мереж і месенджерів, які в часи пандемії коронавірусу та російської війни в Україні займають справді велику частину всього нашого життя, особливо в роботі. Крім того, проблема зі спамом і спамерами є як ніколи актуальною, кількість спаму в робочому текстовому потоці постійно збільшується. Під спамом ми розуміємо текстовий вміст, який не є необхідним у конкретному текстовому потоці, у випадку спамера мається на увазі особа, яка надсилає спам-повідомлення у своїх цілях. Стаття призначена для вирішення науково-прикладної проблеми виявлення спамерів та ідентифікації спам-повідомлень у текстовому контексті будь-якої соціальної мережі чи месенджера з використанням різних алгоритмів виявлення спаму та підходів виявлення спамерів. Ми реалізували 4 алгоритми: алгоритм, що використовує наївний байєсівський класифікатор, опорно-векторну машину, багатошарову нейронну мережу перцептрона та згорткову нейронну мережу. Дослідження було проведено з метою впровадження алгоритму виявлення спаму, який легко інтегрувати в месенджер (у нашому випадку ми використали Telegram як приклад). Створений алгоритм розпізнає спам на основі контексту конкретного текстового потоку, видаляє спамповідомлення та блокує спамера, доки один із менеджерів програми не розблокує користувача-спамера.
Сьогодні існує багато різних соціальних мереж і месенджерів, які в часи пандемії коронавірусу та російської війни в Україні займають справді велику частину всього нашого життя, особливо в роботі. Крім того, проблема зі спамом і спамерами є як ніколи актуальною, кількість спаму в робочому текстовому потоці постійно збільшується. Під спамом ми розуміємо текстовий вміст, який не є необхідним у конкретному текстовому потоці, у випадку спамера мається на увазі особа, яка надсилає спам-повідомлення у своїх цілях. Стаття призначена для вирішення науково-прикладної проблеми виявлення спамерів та ідентифікації спам-повідомлень у текстовому контексті будь-якої соціальної мережі чи месенджера з використанням різних алгоритмів виявлення спаму та підходів виявлення спамерів. Ми реалізували 4 алгоритми: алгоритм, що використовує наївний байєсівський класифікатор, опорно-векторну машину, багатошарову нейронну мережу перцептрона та згорткову нейронну мережу. Дослідження було проведено з метою впровадження алгоритму виявлення спаму, який легко інтегрувати в месенджер (у нашому випадку ми використали Telegram як приклад). Створений алгоритм розпізнає спам на основі контексту конкретного текстового потоку, видаляє спамповідомлення та блокує спамера, доки один із менеджерів програми не розблокує користувача-спамера.
Опис
Ключові слова
spam, social network, naive Bayesian classifier, Support-vector machine, multilayer perceptron neural network, convolution neural network, spammers detection, спам, соціальна мережа, наївний байєсівський класифікатор, опорно-векторна машина, багатошарова персептронна нейронна мережа, згорткова нейронна мережа, виявлення спамерів
Бібліографічний опис
Research application of the spam filtering and spammer detection algorithms on social media and messengers / A. Podorozhniak, N. Liubchenko, V. Oliinyk, V. Roh // Сучасні інформаційні системи = Advanced Information Systems. – 2023. – Т. 7, № 3. – С. 60-66.