Система «Окулус» должна заработать через четыре месяца. Ну… это вряд ли.

Система поиска противоправного контента уже получила название – «Окулус». Так называют окна круглой или овальной формы, в том числе в крыше, которые в христианской культуре стали ассоциироваться со всевидящим «оком Господним».

Обойдется система, основанная на нейросетях, в 57,7 млн рублей, а основной ее задачей станет поиск и анализ фотографий, видео и текстов в соцсетях, на сайтах и даже в мессенджерах. Искать искусственный интеллект будет любой противоправный контент:

  • материалы с признаками экстремизма и терроризма,
  • призывы к массовым незаконным мероприятиям,
  • выражение явного неуважения к обществу, государству и официальным символам России,
  • информация о способах совершения суицида и методах изготовления наркотиков,
  • пропаганда нетрадиционных сексуальных отношений и демонстрация употребления табачной продукции.
Согласно отчету «ВКонтакте», создатели контента опубликовали более 4 млн новых клипов в первом квартале 2022 года. То есть только короткие ролики и только в «ВКонтакте» – 1,3 миллиона в месяц. Итого – 40 000+ в день. При этом, согласно техзаданию, за сутки «Окулус» должен просматривать 200 000 изображений в сутки – по 2,35 в секунду.

Разработкой «Окулуса» займется компания «Эксикьюшн Эр Ди Си» (Execution RDS), а курировать работы будет «Главный радиочастотный центр», входящий в структуру Роскомнадзора. Это первый госзаказ для компании, которая занимается преимущественно разработкой и внедрением решений на базе софта немецкой компании SAP SE (обработка данных и информационных потоков).

«Похожие, но более примитивные системы, уже есть. Их используют, например, юридические конторы. С помощью нейросетей юристы следят за нарушениями авторских прав на товарные знаки. Но системы парсят поисковую выдачу, а не сайты и мессенджеры. Тут же хотят создать более сложную систему в невероятно сжатые сроки», – говорит заместитель начальника отдела ИТ МЦРПО Виктор Смольский.

Действительно, времени на разработку не так много – проект должен быть завершен к 12 декабря 2022 года. То есть, на все про все у компании менее четырех месяцев. Реально ли создать и обучить нейросеть отличать противоправный контент от вполне законного за такое время? Эксперты сомневаются.

Подобная система может десятки лет только данные для обучения собирать. Это небыстрый процесс, так как для каждой схемы, для каждого (!) типа противоправного контента надо найти правильные примеры в количестве одного миллиона штук. А как разработчики будут их искать, скачивать и т.д. – неизвестно.

Александр Белов

project-менеджер TexTerra, сертифицированный специалист по нейросетям

В технической документации указано, что «Окулус» будет работать в режиме реального времени, анализируя изображения, видео, тексты, переписки в чатах и посты в каналах мессенджеров. Внимание будет уделяться даже URL-адресам, в которых тоже может содержаться противоправный контент.

Определенно, система будет ошибаться и кому-то «прилетит» ни за что. Напишет пользователь, скажем, фразу «Я, конечно, не уверен, что всё идет, как нужно, но Путин – хороший человек», а система распознает ее как негативный сценарий. И всё – лови жалобу в адрес администрации ресурса и бан.

Александр Белов

TexTerra

Работа с текстами вопросов не вызывает, но как будет определяться противоправный контент в «сценах, сочетаниях предметов, композициях образов, лицах, статике и динамике движений» даже представить сложно.

Например, нейросеть научат распознавать лица, а также символику, для чего должен быть реализован «функционал каталогов определяемой символики, сцен и действий, персоналий».

Оценить вероятную степень эффективности «Окулуса» сложно. Например, я не представляю, как они будут это всё считывать. Полагаю, что ВКонтакте и Яндекс могут дать открытый доступ и внедрить в систему парсинг (автоматизированный сбор неструктурированной информации – прим. ред.) под предлогом выявления госизмен. Не исключаю доступ на парсинг и к базам данных… А остальное?

Александр Белов

TexTerra

Кроме того, по оценкам специалистов система потребует около 50 серверов (примерно по 150 тысяч рублей за каждый без стоимости установки и обслуживания), которые надо оснастить графическими ускорителями (еще по 100-150 тысяч рублей за каждый). Только на оборудование понадобится 15 млн рублей.

Но главную проблему эксперты видят не в этом. От «Эксикьюшн Эр Ди Си» требуют разработки принципиально новой системы, для чего четырех месяцев, мягко говоря, мало, не говоря уже о времени, необходимом для обучения нейросетей. Проще говоря, в то, что «Окулус» заработает в декабре, эксперты верят с трудом или вовсе не верят.

#
Разработка Нейросети
© «TexTerra», при полном или частичном копировании материала ссылка на первоисточник обязательна.