Доброго дня, уважаемые. Нужна ваша небольшая но крайне полезная помощь.
Я тут пилю тулзу для анализа телеги и комментариев/настроений в ней. И для того чтобы фильтровать там ватанов и ватных ботов мне нужен список слов и выражений которые будут служить триггерами для определения представителей данной фауны.
Так вот, собственно сам запрос. Накидайте пожалуйста немного каналов (можно телеги, можно ютуба, не важно, можно отдельные топики на пикабу), так чтобы там тусовались дистилированные представители, где бы про Украину эти ребята рассуждали, а я уже оттуда надергаю то что мне нужно.
Буду благодарен.
Ну а если кто знает где такой словарь найти уже готовый - это конечно был бы подарок подарков. И сэкономило бы мне немного времени.
Подробнее
песочница политоты,политика,политические новости, шутки и мемы,пидоры помогите,реактор помоги,Война в Украине
Еще на тему
Про ютуб: не беря в расчет первыми приходящие в голову как наиболее очевидные проплаченные бот-каналы (можно на джое по тегу "боевые пидоры" пройтись, там есть примеры таковых), смело бери абсолютно любой канал, где хоть как-то критикуется путинская политика и читай комментарии или (по моим прикидкам, что даже проще) посты в сообществе.
Медуза, дождь, настоящее время, новая газета, медиазона, важные истории, навальный... это что только навскидку вспомнил, наверняка еще немало есть.
Украинские каналы вроде фридом, униан, 1+1, 24 канал, золкин - опять же, в первую очередь смотри комментарии под постами в сообществе.
В ВК это ещё можно определить по аккаунтам, в телеге ботов не отличить.
Ещё каналы могут быть исключительно из ботов, ибо например кто ещё будет поддерживать размазана дырявого?
Была еще мысль глядеть активность по будним дням и в рабочее время и если переваливает за Н и активность тольк в рабочее время - то не учитывать таких юзеров в финальной статистике и рассматривать как "вероятно бот". Но это тоже не очень надежный путь я это понимаю.
Но по факту цель моя не ботов искать, а сделать инструмент который будет суммаризировать настроения и главное разделять все что сказано в комментириях на 3-10 нарративов для для отдельного поста (основная функция). Пускай даже туда боты попадут. Так как они несмотря на свою нереальность настроения формируют все равно хочешь ты этого или нет. И совсем их не учитывать тоже не верно.
Поиск ватников это просто сайд фича.
Каналы типа рамзана меня мало интересуют. Интересуют те где присутствуют реальные юзеры. Ну и как я сказал, это все нацелено исключительно на украинский сегмент интернета.
90% таких ботов
https://t.me/creationdatebot
дата примерная но суть понятна
чем смог - тем помог
¯\_(ツ)_/¯
Примерно до середины 2020 года. Потом он вычисляет дату сильно неверно. Видимо датасет по которому он работает заканчивается 2020-м годом.
"Если пишут вам про жопы,
Про хуи, говно и рот
Знайте дети, это точно
Пишет ватный патриот!"
Кстати, вдруг пригодится: https://gosvon.net https://gosvon.net/docs/api
Это боты в ВК
у ходорковского ватаны очень калоритные в коментах, а так аль пишут про запад, нато, чето хорошее про китай, укронацистьов, бандер, чурок, вторую армию мира госдолг сша, ссылаються на телевизор то это ватан ебаный
На самом деле на этапе тестирования сбора датасетов всплывать стали очень интересные вещи про информационную войну рф в тележечке. Будет время и вдохновение я тут хотя бы один пост запилю по теме.