Также нейросеть научат анализировать действия пользователей.

До сих пор выявлять запрещенный контент в сети Роскомнадзору приходилось вручную, тратя на это множество человеко-часов и денег. Но теперь все изменится.

В ведомстве запустили систему автоматического поиска запрещенного контента «Окулус», которая основывается на искусственном интеллекте.

«Информационная система "Окулус" уже запущена и выполняет возложенные на нее задачи в полном объеме: выявляет нарушения законодательства в изображениях и видеоматериалах», – заявил «Ведомостям» представитель подведомственного Роскомнадзору Главного радиочастотного центра (ФГУП ГРЧЦ).

Система была успешно протестирована в декабре 2022 года, а в январе 2023-го началась ее интеграция с другими инструментами мониторинга Роскомнадзора.

Кто разработал «Окулус»

Разработчиком «Окулуса» стала компания IT-компания Execution RDC. Она специализируется на внедрении решений для автоматизации процессов корпоративного бизнеса: построение и оптимизация аналитических моделей для retail, warehouse management, производства, создание корпоративных приложений, систем, требующих высокоскоростной работы с большими массивами данных и многое другое.

Разработки ведутся на базе программных продуктов SAP AG с применением собственных решений компании в областях Big Data и Machine learning. То есть в деле создания и обучения нейросетей компания, работающая на рынке с 2010 года, не новичок.

Среди клиентов Execution RDC, например, – «Объединенная металлургическая компания», «Северсталь», «Останкинский мясоперерабатывающий комбинат», Mail.ru Group, X5 Retail Group и другие. Теперь среди клиентов и Роскомнадзор через ФГУП ГРЧЦ.

Для чего нужен «Окулус»

Система занимается выявлением запрещенных российским законодательством изображений и видео на сайтах и в соцсетях.

«Система распознает изображения и символы, противоправные сцены и действия, анализирует текст в фото- и видеоматериалах. "Окулус" автоматически обнаруживает такие правонарушения, как экстремистская тематика, призывы к массовым незаконным мероприятиям, суициду, пронаркотический контент, пропаганда ЛГБТ и др.», – пояснил представитель ФГУП ГРЧЦ.

Как работает «Окулус»

Система ведет анализ по заданным требованиям. По сути это классификатор с заданным набором источников информации. То есть информация лишь классифицируется – это не сбор данных. Более детальных объяснений в Execution RDC не дают, ссылаясь на подписанные с ФГУП ГРЧЦ соглашения о неразглашении.

Если в ручном режиме отдельный оператор может классифицировать 106 изображений и 101 видео в день, то «Окулус» анализирует более 200 000 изображений в сутки, тратя на каждое изображение примерно три секунды. То есть проверка контента ускорится, а значит, и расширится.

Как будут развивать «Окулус»

К 2025 году функции системы будут расширены.

«Прорабатывается возможность добавления новых классов и типов нарушений, а также функции определения поз людей и их действий. Система будет выявлять запрещенные материалы на нескольких кадрах на видеофрагментах, в сложных рукописных текстах и рисованном контенте», – рассказал представитель ФГУП ГРЧЦ.

В общем система станет детально анализировать все действия пользователей в интернете: что выкладывается, как комментируется и, главное, насколько это законно. Теперь при создании контента рекомендуется внимательнее проверять его на предмет двусмысленности, например.

Сколько стоит «Окулус»

Тендер на разработку «Окулуса» появился на сайте госзакупок летом 2021 года. Точнее, сначала был тендер на разработку техзадания с вознаграждением 15 млн руб. Затем появился тендер на разработку системы, которую оценили в 57,7 млн руб. Учитывая стоимость серверов и прочей инфраструктуры «Окулус» обошелся в 1,5 млрд руб.

Зачем понадобился «Окулус»

В ФГУП ГРЧЦ ссылаются на лавиноподобный рост числа фейковых новостей в последние годы, а также материалов с пропагандой употребления наркотиков, призывами к суициду, детской порнографией: «такой контент необходимо находить и блокировать до того, как он широко разойдется в онлайн-пространстве, особенно среди детей и молодежи».

«Действительно, системы искусственного интеллекта для аналитики такой информации очень нужны. Есть ряд независимых систем, в том числе тех, которые мы используем в своей работе, но государственной такой системы до последнего времени не было», – отметила генеральный директор Лиги безопасного интернета Екатерина Мизулина.

Читайте также:

Чат-бот сдал экзамен по MBA на 4. Интервью с приемной комиссией

С любимыми не расставайтесь! – оживляем человека

Люди больше не нужны: кошка Mittens, Replika и другие наши ИИ-друзья

#
Нейросети
© «TexTerra», при полном или частичном копировании материала ссылка на первоисточник обязательна.