Розпізнавання матеріалів із ознаками замовності за допомогою семантичного аналізу

Abstract

Матеріали із ознаками замовності ("джинса") становлять проблему як для професійних українських медіа, так і для нових (наприклад, телеграм-канали). Подібні тексти можуть вводити в оману аудиторію, а також порушують журналістські цінності та норми. Як правило, виявлення таких матеріалів відбувається вручну. В умовах інформаційного перенасичення, коли маніпулятивні тексти з'являються поряд із якісними журналістськими публікаціями, дуже важливо розробити алгоритм розпізнавання таких матеріалів - за допомогою комп'ютерного аналізу. Таким чином медіаексперти могли б використовувати цей аналіз для первинного виявлення проблеми, а згодом - додатково опрацьовувати тексти вручну.

Мета цього дослідження - запропонувати і протестувати алгоритм розпізнавання матеріалів із ознаками замовності за допомогою NLP (natural language processing, а саме - семантичного аналізу, мова Python, бібліотека Spacy). 

Матеріал дослідження - один із найбільш популярних телеграм-каналів України "Україна Сейчас"

Author (co-authors)
First name Last name Institutional affiliation E-mail Phone number ORCID ID Institution address Author contribution(s) Institutional affiliation
Наталія
Стеблина
n.steblyna@donnu.edu.ua
0000-0001-9799-9786
Вінниця, вул. 600-річчя, 21
Writing – Original Draft Preparation
Vasyl' Stus Donetsk National University