«ВКонтакте» объявила о том, что запускает новую опцию для сообществ — фильтр для борьбы с враждебными высказываниями, основанный на нейросети. Администраторы пабликов сами вправе решать, включать его или нет — по умолчанию он выключен. На данный момент новая опция уже прошла предварительное тестирование, но сейчас доступна только половине сообществ. В ближайшем будущем она заработает у всех.
В текущей реализации фильтр способен определять прямые угрозы в виде пожеланий кончины, обещаний причинить вред здоровью или угроз расправы. В будущем нейросеть научится определять и прочие признаки нетерпимости, в том числе и те, которые основаны на национальной или религиозной принадлежности. Администраторам сообществ отображаются комментарии, которые были удалены фильтром. При желании, их можно восстановить, но в рамках тестового запуска руководители пабликов восстановили лишь 1% сообщений — видимо, нейросеть действительно хорошо справляется.
Изначально «ВКонтакте» начала открыто тестировать новый фильтр в ноябре 2020 года — с того времени им воспользовались 13 млн публичных страниц, что составляет больше 10% сообществ соцсети. После подключения функции лишь 1,8% отказались от неё. По словам разработчиков, нейросеть тренировалась именно для понимания разговорной речи: её обучали на субтитрах к кино и видео. Благодаря тому, что фильтр определяет угрозы на основе важности слов и их комбинаций, сейчас он правильно определяет враждебность в 80% случаев.
В текущей реализации фильтр способен определять прямые угрозы в виде пожеланий кончины, обещаний причинить вред здоровью или угроз расправы. В будущем нейросеть научится определять и прочие признаки нетерпимости, в том числе и те, которые основаны на национальной или религиозной принадлежности. Администраторам сообществ отображаются комментарии, которые были удалены фильтром. При желании, их можно восстановить, но в рамках тестового запуска руководители пабликов восстановили лишь 1% сообщений — видимо, нейросеть действительно хорошо справляется.
Изначально «ВКонтакте» начала открыто тестировать новый фильтр в ноябре 2020 года — с того времени им воспользовались 13 млн публичных страниц, что составляет больше 10% сообществ соцсети. После подключения функции лишь 1,8% отказались от неё. По словам разработчиков, нейросеть тренировалась именно для понимания разговорной речи: её обучали на субтитрах к кино и видео. Благодаря тому, что фильтр определяет угрозы на основе важности слов и их комбинаций, сейчас он правильно определяет враждебность в 80% случаев.