Бедный Робби или Как мы ломали искусственный интеллект

24 Июнь 2022

Александр Хлынов

Редактор TexTerra

Время чтения: 10 минут

ВК выкатил сервис по проверке рекламных объявлений. Робби пока как-то не очень справляется.

Специалисты ВКонтакте выкатили искусственный интеллект по имени Робби, который должен помогать рекламодателям быстро рассчитывать, сколько процентов в их объявлениях занимает текст. Дело в том, что на разных площадках действуют свои ограничения по количеству знаков на рекламных креативах. Во ВКонтакте текст не должен занимать более 20% от общей площади изображения.

При этом нейросеть использует компьютерное зрение и анализаторы текста, а также прошла обучение (то есть имеет накопленную экспертизу и способно различать, что изображено на фото).

Робби уже работает в открытом доступе – для него запущен сайт. Загрузив объявление, там можно проверить не только объем текста поверх фото, но и выяснить, можно ли считать то или иное изображение порнографией. Искусственным интеллектом от ВКонтакте уже пользуются, например, соцсеть «Одноклассники», рекламная платформа My Target, «Юла», мессенджеры (какие именно – не указывается), Игры@mail.ru и «Ситимобил», для которых эта услуга не бесплатна. Мы же с вами не должны ничего за нее платить – сейчас Робби оценивает наши объявления за так.

Требования к загружаемым объявлениям:

минимальный размер каждой из сторон — 30 px,
форматы изображения — только JPG и PNG,
файлы размером не более 5 Мб.

Естественно, мы проверили работу Робби, подсовывая ему не самые простые варианты объявлений.

Объявление четко под требования

Первым на суд Робби было отдано объявление, в котором текст закрывает только 20% поверхности, как того требует ВКонтакте.

ИИ насчитал площадь текста в 32% – почти треть. Признаем, что задание было непростым, в узорах можно увидеть что угодно – проверено молодежью 1970-х. Возможно, в «складках» гор и неба Робби увидел буквы. Либо он считает занятым текстом весь участок фото он верхушки первой буквы до хвостика буквы «у» в последней строке, и во всю ширину объявления.

Текст по тексту

Мало кто из рекламодателей додумается выкладывать объявление, в котором текст наложен на сфотографированный текст. Но бывает всякое. Нам же интересно, может ли Робби отличить подложку от рекламного текста и не объединять их в один. Чтобы облегчить задачу, мы взяли текст, написанный языком программирования.

Доля текста на изображении оказалась 100-процентной. Логично. Но слишком прямолинейно. С точки зрения рекламы, Робби должен был отделять «абракадабру» от рекламного текста.

Реклама книги или афиши

Тогда мы упростили задачу и для подложки выбрали снимок афиши на английском языке.

Результат оказался неожиданным – 58% текста. Не 90%, как мы ожидали, и не 30%, если бы индексировался только наложенный текст, а «среднее арифметическое» – не вам, не нам.

Трудночитаемый текст

Попытка обмануть Робби с помощью плохо различимого текста оказалась успешной. Когда часть букв сливается с фоном, но по видимым символам все же можно прочитать написанное, ИИ считает только то, что видно.

То есть, креатив типа «Коммерсантъ – это про …» и далее только часть букв, как в «Поле чудес», может пройти, и это хорошо. Итог 15% текста вместо ожидаемых 50% можно считать «форточкой возможностей».

Иероглифы и вязь

Если на упаковке рекламируемого товара будут хоть какие-то буквы, то на справедливый результат рассчитывать не стоит. Даже если это китайские иероглифы или арабская вязь. Это мы выяснили, отдав на оценку Робби три разных объявления, на которых текст на русском занимает не более 20%.

Результат оказался, исходя из предыдущих опытов, предсказуемым – от 27% до 39%. То есть, любые символы на фото увеличивают процент текста, хотя это может быть что угодно для аудитории, но не текст.

Эротика, порно и норма

Проверив умение Робби определять порно и эротику, мы тоже обнаружили несколько багов. Например, вы не сможете продать картины с обнаженкой, если за цензуру будет отвечать Робби, но разбогатеете на торговле разноцветными (только не телесного цвета) интимными товарами для взрослых.

В целом Робби справился, но он плохо отличает порно от эротики (хотя и люди плохо их различают). ИИ пропустил изображение цветных фаллоимитаторов, хотя «поймал» изображение их же телесного цвета.

Полуобнаженная девушка – «очень похоже на эротику».

Полуобнаженная пара на пляже – «очень похоже на эротику».

Обнаженная девушка (по факту видно только грудь) – «очень похоже на порнографию».

Порно (с половыми органами) цветное – «очень похоже на порнографию».

Цветные фаллоимитаторы – «изображение не содержит порнографии».

Фаллоимитатор телесного цвета – «очень похоже на порнографию».

Картина с обнаженной девушкой от признанного художника – «очень похоже на порнографию».

Дарья Завьялова

выпускающий редактор TexTerra

Это еще не итог

Искусственный интеллект все еще проигрывает человеку в том, что касается социальных норм и договоренностей. Он обыграет любого в шахматы, но отличить фон от текста на фотографии ему пока сложно. Как и порно от эротики, и оба эти явления – от искусства. Но нейросети обучаемы, и чем дольше они работают, чем шире накопленная экспертиза, тем лучше они справляются с задачей. Со временем Робби будет делать меньше ошибок. Но пока полагаться на его подсчеты и суждения стоит с осторожностью.

Новый Чебурашка: что ты такое и за что?!

Александр Хлынов

Редактор TexTerra

Все статьи этого автора

Последние статьи автора:

Штраф за сообщение: что бизнесу нельзя отправлять в мессенджерах

Что подарить на 8 марта? — список стоящих идей от женщин!

#