Слова эпохи пандемии
В прошлом году редакция “Миллиард. Татар” составила список выражений 2021 года посредством редакционного обсуждения. В этом году опробован машинный способ определения слова года на базе текстов татароязычных telegram-каналов, освещающих жизнь как в столице, так и в районах Татарстана.
Нас интересовала важность слов, которые выделяют отдельно 2020, 2021 и 2022 годы.
Результаты представлены на Рисунке 1. Так, словом 2020-го года в татарском сегменте Telegram стал «код». Здесь имеется в виду отсылка к QR-кодам, которые вводились властями для контроля за передвижением граждан во время самоизоляции, вызванной пандемией коронавируса. «Covid» и «коронавирус» также присутствуют в списке слов, отличающих 2020-й год. Интересно, что в топе списка оказались также слова «зодиак», «гороскоп», «знаки». Этот результат можно проинтерпретировать как попытку авторов районных telegram-каналов скопировать зарекомендовавшие себя форматы из других социальных сетей.
Именно в 2020-м году татароязычные редакции начинают активно вести свои сообщества в мессенджере. Возможно, потребовалось некоторое время для адаптации под форматы, привычные для новой площадки, либо, наоборот, пришлось копировать зарекомендовавшие себя сюжеты для аудитории, которая стала медленно мигрировать в Telegram (всплеск интереса произойдет в 2022-м году).
Эпоха СВО
В 2021-м году тема пандемии никуда не делась. В топе слово “коронавирус”. Также встречается слово “QR” (код), “саклау”, “covid”, которые свидетельствуют о том, что тема общественного здоровья продолжала сохранять актуальность. При этом важно подчеркнуть различие в подаче самой темы. Если в 2020 году речь шла о физическом контроле передвижения людей, чтобы избежать массовых вспышек заражения, то в следующем году фокус сделан на освещение темы в целом - появление новых штаммов, ежедневная сводка о количестве заболевших, реакция властей на кризис, освещение мер поддержки и так далее.
2022-й год в татарском сегменте Telegram связан со словом “мобилизация”. В топе также фигурируют слова “хәрби” (военный), “операция”, “саклау” (защита), “мобилизацияләнгән” (мобилизованный). Очевидно, тема затронула многих, а потому не могла быть обойдена telegram-каналами, которые часто ведутся журналистскими коллективами, освещающими, прежде всего, локальную повестку.
МЕТОДОЛОГИЯ
При анализе лексических состава татароязычный телеграм-каналов в выборку был включен 22 telegram-канал: Шахри Казан, Интертат, Сююмбике, Кряшены Туганайлар, Татмедиа Junior, Көмеш кыңгырау, Шахри Чаллы, Яшел Үзән Онлайн, Азнакаево онлайн, Актаныш-информ, Апастово новости, Арск-информ, Әтнә таңы, Балтаси Хезмэт, Кайбицкий район новости, Мензелинск news, Муслюмово-информ, Саба таңнары, Сарман, Тюлячи информ, ТНВ Татарча. Всего было проанализировано 129416 постов за период с 2017 по 2022 годы. Так как 18 каналов не функционировали в 2017-2019 годах, решено было сфокусироваться на 2020-2022 годах.
Задача заключается в том, чтобы выявить те слова, которые были характерны именно для определенного года. Для этого мы используем метрику tf-idf (term frequency - inverse document frequency). Она предназначена для измерения того, насколько важным является слово для данного документа во всем корпусе документов, например, для одного романа в коллекции романов того или иного автора. Важно отметить, что речь идет не о самых частотных, а о тех словах, которые отличают интересующие нас временные промежутки от всего корпуса сообщений.
Источник фото на анонсе: ru.freepik.com