Новини Київської області
Технології

Український «Фейкогриз» переміг на міжнародному конкурсі Sigma Awards-2020


Український проєкт моніторингу тем російської дезінформації переміг на міжнародному конкурсі журналістики даних у номінації "Найкращий новинний застосунок". Цього року у фіналі конкурсу цієї категорії змагалися проєкти від таких видань, як Washington Post та ThePudding.

Український «Фейкогриз» переміг на міжнародному конкурсі Sigma Awards-2020

Sigma Awards - це новий конкурс, який прославляє найкращу журналістику даних в усьому світі, а також допомагає навчитися нового світовій спільноті журналістів цієї області. 5 лютого 2020 року було завершено прийом заявок на участь у Sigma Awards-2020 з приголомшливим числом 510 проєктів з 66 країн та регіонів. Оцінювали конкурс 24 міжнародних експерти, що розглянули заявки й вибрали десять переможців у шести категоріях. Разом вони представляють кращу журналістику даних з усього світу.

Проєкт

TEXTY розробила платформу збору й аналізу даних, а також інструментальну панель, яка показує загальну динаміку тем російської дезінформації в маніпулятивних новинах. Проєкт виконує нейролінгвістичне програмування на тисячі новин щотижня, щоб виявити саме маніпулятивні та згрупувати їх за темами й мета-темами, для відображання на інтерактивній панелі.

Крім того, TEXTY розробили додаток «Фейкогриз», реалізований на одній платформі (для Chrome та Firefox). Він автоматично сигналізує користувачам про скомпрометований контент і може використовуватися для збору пропозицій про можливі неякісні/підроблені/маніпулятивні новини.

Технології

Представлений проєкт був створений на основі моделей машинного навчання для української та російської мов. Дані для перевірки завантажуються з RSS-каналів, сайтів або посилань на сторінках у Facebook.

Попередньо оброблені дані про новини зберігаються в PostgreSQL. Кожен текст, що готується для аналізу: розмічається на мовні одиниці - слова і розділові знаки та лемматизуються для тематичного моделювання. Далі тексти оцінюються за допомогою маніпулятивного класифікатора новин (російською та українською мовами на основі ULMFiT, запрограмованою в Pytorch/fast.ai) - оцінюється ймовірність того, що новини містять емоційні маніпуляції та/або помилкову аргументацію. Обрані маніпулятивні новини, в середньому ~3000 штук в тиждень, розбиваються на теми за допомогою автоматичного моделювання тем (NMF).

Далі редакція відбувається вручну: об'єднуються схожі теми, відкидаються непотрібні або занадто загальні. Кожна підтема в новинному додатку проілюстрована підбіркою заголовків з новин, які належать їй, щоб нові читачі знали, про що вона.

Український «Фейкогриз» переміг на міжнародному конкурсі Sigma Awards-2020

Перемога

Відстеження змісту та інтенсивності російських дезінформаційних оповідань й маніпулятивної інформації показує загальну динаміку впливу Росії на інформаційний простір України. Довгострокове відстеження дезінформації дозволяє побачити, які теми найбільш важливі для російської влади, хто є для них найбільшим подразником, і що вони планують робити в майбутньому в Україні.

Поінформований – значить озброєний!

Фото матеріали з відкритих джерел