Розпізнавання матеріалів із ознаками замовності за допомогою семантичного аналізу

Abstract

Матеріали із ознаками замовності ("джинса") становлять проблему як для професійних українських медіа, так і для нових (наприклад, телеграм-канали). Подібні тексти можуть вводити в оману аудиторію, а також порушують журналістські цінності та норми. Як правило, виявлення таких матеріалів відбувається вручну. В умовах інформаційного перенасичення, коли маніпулятивні тексти з'являються поряд із якісними журналістськими публікаціями, дуже важливо розробити алгоритм розпізнавання таких матеріалів - за допомогою комп'ютерного аналізу. Таким чином медіаексперти могли б використовувати цей аналіз для первинного виявлення проблеми, а згодом - додатково опрацьовувати тексти вручну.

Мета цього дослідження - запропонувати і протестувати алгоритм розпізнавання матеріалів із ознаками замовності за допомогою NLP (natural language processing, а саме - семантичного аналізу, мова Python, бібліотека Spacy).

Матеріал дослідження - один із найбільш популярних телеграм-каналів України "Україна Сейчас"

Keywords (in English)

journalism

manipulations

computer analysis

Author (co-authors)

First name	Last name	Institutional affiliation	E-mail	Phone number	ORCID ID	Academic status, position	Institution address	Author contribution(s)	Institutional affiliation
Наталія	Стеблина		n.steblyna@donnu.edu.ua		0000-0001-9799-9786		Вінниця, вул. 600-річчя, 21	Writing – Original Draft Preparation	Vasyl' Stus Donetsk National University