SEO-продвижение сайта от 150 000 рублей

Заказать звонок
Телефон отдела продаж:
8 (800) 775-16-41
Наш e-mail:
mail@texterra.ru
Заказать услугу
Бедный Робби или Как мы ломали искусственный интеллект Редакция «Текстерры»
Редакция «Текстерры»

Специалисты ВКонтакте выкатили искусственный интеллект по имени Робби, который должен помогать рекламодателям быстро рассчитывать, сколько процентов в их объявлениях занимает текст. Дело в том, что на разных площадках действуют свои ограничения по количеству знаков на рекламных креативах. Во ВКонтакте текст не должен занимать более 20% от общей площади изображения.

При этом нейросеть использует компьютерное зрение и анализаторы текста, а также прошла обучение (то есть имеет накопленную экспертизу и способно различать, что изображено на фото).

Робби уже работает в открытом доступе – для него запущен сайт. Загрузив объявление, там можно проверить не только объем текста поверх фото, но и выяснить, можно ли считать то или иное изображение порнографией. Искусственным интеллектом от ВКонтакте уже пользуются, например, соцсеть «Одноклассники», рекламная платформа My Target, «Юла», мессенджеры (какие именно – не указывается), Игры@mail.ru и «Ситимобил», для которых эта услуга не бесплатна. Мы же с вами не должны ничего за нее платить – сейчас Робби оценивает наши объявления за так.

Требования к загружаемым объявлениям:

  • минимальный размер каждой из сторон — 30 px,
  • форматы изображения — только JPG и PNG,
  • файлы размером не более 5 Мб.

Естественно, мы проверили работу Робби, подсовывая ему не самые простые варианты объявлений.

Объявление четко под требования

Первым на суд Робби было отдано объявление, в котором текст закрывает только 20% поверхности, как того требует ВКонтакте.

Искусственный интеллект Робби от ВКонтакте

ИИ насчитал площадь текста в 32% – почти треть. Признаем, что задание было непростым, в узорах можно увидеть что угодно – проверено молодежью 1970-х. Возможно, в «складках» гор и неба Робби увидел буквы. Либо он считает занятым текстом весь участок фото он верхушки первой буквы до хвостика буквы «у» в последней строке, и во всю ширину объявления.

Искусственный интеллект Робби от ВКонтакте
Продвинем ваш бизнес
Подробнее

Текст по тексту

Мало кто из рекламодателей додумается выкладывать объявление, в котором текст наложен на сфотографированный текст. Но бывает всякое. Нам же интересно, может ли Робби отличить подложку от рекламного текста и не объединять их в один. Чтобы облегчить задачу, мы взяли текст, написанный языком программирования.

Искусственный интеллект Робби от ВКонтакте

Доля текста на изображении оказалась 100-процентной. Логично. Но слишком прямолинейно. С точки зрения рекламы, Робби должен был отделять «абракадабру» от рекламного текста.

Искусственный интеллект Робби от ВКонтакте

Реклама книги или афиши

Тогда мы упростили задачу и для подложки выбрали снимок афиши на английском языке.

Искусственный интеллект Робби от ВКонтакте

Результат оказался неожиданным – 58% текста. Не 90%, как мы ожидали, и не 30%, если бы индексировался только наложенный текст, а «среднее арифметическое» – не вам, не нам.

Искусственный интеллект Робби от ВКонтакте

Трудночитаемый текст

Попытка обмануть Робби с помощью плохо различимого текста оказалась успешной. Когда часть букв сливается с фоном, но по видимым символам все же можно прочитать написанное, ИИ считает только то, что видно.

Искусственный интеллект Робби от ВКонтакте

То есть, креатив типа «Коммерсантъ – это про …» и далее только часть букв, как в «Поле чудес», может пройти, и это хорошо. Итог 15% текста вместо ожидаемых 50% можно считать «форточкой возможностей».

Искусственный интеллект Робби от ВКонтакте

Иероглифы и вязь

Если на упаковке рекламируемого товара будут хоть какие-то буквы, то на справедливый результат рассчитывать не стоит. Даже если это китайские иероглифы или арабская вязь. Это мы выяснили, отдав на оценку Робби три разных объявления, на которых текст на русском занимает не более 20%.

Искусственный интеллект Робби от ВКонтакте
Искусственный интеллект Робби от ВКонтакте
Искусственный интеллект Робби от ВКонтакте

Результат оказался, исходя из предыдущих опытов, предсказуемым – от 27% до 39%. То есть, любые символы на фото увеличивают процент текста, хотя это может быть что угодно для аудитории, но не текст.

Искусственный интеллект Робби от ВКонтакте
Искусственный интеллект Робби от ВКонтакте
Искусственный интеллект Робби от ВКонтакте

Эротика, порно и норма

Проверив умение Робби определять порно и эротику, мы тоже обнаружили несколько багов. Например, вы не сможете продать картины с обнаженкой, если за цензуру будет отвечать Робби, но разбогатеете на торговле разноцветными (только не телесного цвета) интимными товарами для взрослых.

В целом Робби справился, но он плохо отличает порно от эротики (хотя и люди плохо их различают). ИИ пропустил изображение цветных фаллоимитаторов, хотя «поймал» изображение их же телесного цвета.

  1. Полуобнаженная девушка – «очень похоже на эротику».
  2. Полуобнаженная пара на пляже – «очень похоже на эротику».
  3. Обнаженная девушка (по факту видно только грудь) – «очень похоже на порнографию».
  4. Порно (с половыми органами) цветное – «очень похоже на порнографию».
  5. Цветные фаллоимитаторы – «изображение не содержит порнографии».
  6. Фаллоимитатор телесного цвета – «очень похоже на порнографию».
  7. Картина с обнаженной девушкой от признанного художника – «очень похоже на порнографию».
Дарья Завьялова

Дарья Завьялова

выпускающий редактор TexTerra

Это еще не итог

Искусственный интеллект все еще проигрывает человеку в том, что касается социальных норм и договоренностей. Он обыграет любого в шахматы, но отличить фон от текста на фотографии ему пока сложно. Как и порно от эротики, и оба эти явления – от искусства. Но нейросети обучаемы, и чем дольше они работают, чем шире накопленная экспертиза, тем лучше они справляются с задачей. Со временем Робби будет делать меньше ошибок. Но пока полагаться на его подсчеты и суждения стоит с осторожностью.

Читайте также
Новый Чебурашка: что ты такое и за что?!
Поделиться статьей:

Новое на сайте

25 ноя 2024
9 214
Мобильное приложение для бизнеса: зачем нужно и сколько стоит

Среди главных задач – возможность увеличить средний чек и сократить расходы! Считаем, во сколько вам это обойдется.

25 ноя 2024
24 819
Как работать с YouTube Shorts в 2025 году: график и оптимизация

«Счастливые часы», «Экран мечты» и способы избежать страйков – все, что нужно для миллионных просмотров!

25 ноя 2024
43 572
Как вывести сайт в топ при помощи скрытой семантики (LSI)

LSI (latent semantic indexing) – это скрытое семантическое индексирование. А скрытая семантика позволяет определить релевантность документа ключевому запросу. 

Смотреть все статьи

У вас есть деловой запрос? Давайте обсудим!

Оставьте свои контакты, мы свяжемся с вами в ближайшее время.

Нажимая на кнопку «Оставить заявку», вы подтверждаете свое согласие на обработку пользовательских данных

Спасибо!

Ваша заявка принята. Мы свяжемся с вами в ближайшее время.