Розпізнавання матеріалів із ознаками замовності за допомогою семантичного аналізу

Анотація

Матеріали із ознаками замовності ("джинса") становлять проблему як для професійних українських медіа, так і для нових (наприклад, телеграм-канали). Подібні тексти можуть вводити в оману аудиторію, а також порушують журналістські цінності та норми. Як правило, виявлення таких матеріалів відбувається вручну. В умовах інформаційного перенасичення, коли маніпулятивні тексти з'являються поряд із якісними журналістськими публікаціями, дуже важливо розробити алгоритм розпізнавання таких матеріалів - за допомогою комп'ютерного аналізу. Таким чином медіаексперти могли б використовувати цей аналіз для первинного виявлення проблеми, а згодом - додатково опрацьовувати тексти вручну.

Мета цього дослідження - запропонувати і протестувати алгоритм розпізнавання матеріалів із ознаками замовності за допомогою NLP (natural language processing, а саме - семантичного аналізу, мова Python, бібліотека Spacy). 

Матеріал дослідження - один із найбільш популярних телеграм-каналів України "Україна Сейчас"

Ключові слова (англійською)
Автор (співавтори)
Ім'я Прізвище Приналежність до організації E-mail Номер телефону ORCID ID Вчене звання, посада Адреса організації Внесок автора(ів) Приналежність до організації
Наталія
Стеблина
n.steblyna@donnu.edu.ua
0000-0001-9799-9786
Вінниця, вул. 600-річчя, 21
Написання – оригінальний рукопис
Vasyl' Stus Donetsk National University