Матеріали із ознаками замовності ("джинса") становлять проблему як для професійних українських медіа, так і для нових (наприклад, телеграм-канали). Подібні тексти можуть вводити в оману аудиторію, а також порушують журналістські цінності та норми. Як правило, виявлення таких матеріалів відбувається вручну. В умовах інформаційного перенасичення, коли маніпулятивні тексти з'являються поряд із якісними журналістськими публікаціями, дуже важливо розробити алгоритм розпізнавання таких матеріалів - за допомогою комп'ютерного аналізу. Таким чином медіаексперти могли б використовувати цей аналіз для первинного виявлення проблеми, а згодом - додатково опрацьовувати тексти вручну.
Мета цього дослідження - запропонувати і протестувати алгоритм розпізнавання матеріалів із ознаками замовності за допомогою NLP (natural language processing, а саме - семантичного аналізу, мова Python, бібліотека Spacy).
Матеріал дослідження - один із найбільш популярних телеграм-каналів України "Україна Сейчас"
- Щоб додати коментар, увійдіть або зареєструйтесь