Разобрались в документации по алгоритмам.
Многие сервисы и сайты — «ВКонтакте», Яндекс, Ozon, WildBerries, М.Видео-Эльдорадо — и в том числе Кинопоиск (который принадлежит Яндексу) открыли правила рекомендательных алгоритмов из-за нового законодательства.
Разбираемся, для чего и как работают рекомендации в Кинопоиске.
Для чего Кинопоиск собирает информацию
Основная официально озвученная цель — предоставлять каждому пользователю релевантные и точные тайтлы. Тайтлами называются единицы контента в сервисе — фильмы, сериалы, телеканалы и пр.
Понятно, что также алгоритмы используются для определения и исключения из сервиса нерелевантного и нежелательного контента.
Какие данные о пользователях собирают
Кинопоиск учитывает:
- поисковые запросы тайтлов (единиц контента: фильмов, сериалов, актеров, телеканалов и прочего);
- историю поиска этих тайтлов;
- историю просмотров витрин (это рекомендованные сериалы и фильмы) и тайтлов;
- оценки тайтлов;
- добавление тайтлов в коллекцию.
Всю эту информацию Кинопоиск получает, когда пользователь взаимодействует с сервисом. Еще используются аналогичные агрегированные данные других пользователей. Такой подход при создании сайтов используется в общем для многих сервисов, в том числе для интернет-магазинов, где вам предлагают товары, схожие с теми, что вы покупали ранее. Это очень полезная история как для продавцов, так и для покупателей (нет усталости от просмотра многостраничного каталога товаров).
Как сервис анализирует данные, чтобы выдавать рекомендации
Сервис анализирует данные, о которых речь выше, а также жанр, название, сюжет, актеров, режиссеров, получение фильмом тех или иных наград и премий, историю взаимодействия пользователей с тайтлами, историю просмотров — и на основе этого предлагает пользователю тот или иной тайтл — фильм, подборку по теме, информацию об актере и тп.
Алгоритм использует в работе машинное обучение и нейросети, а также так называемые матричные факторизации — они основаны на множестве видов пользовательского фидбека и разметки контента. Еще используется оценка асессорами (поисковыми роботами) — прямо как в поиске.
Алгоритм принимает решение после того, как проанализирует:
- Отбор релевантных для пользователя единиц контента (то есть отвечающих его интересам подборкам — и тем действиям, что он совершал на сайте Кинопоиска ранее).
- Последующее ранжирование, где каждой единице контента (фильму, сериалу, подборке и т.д.) присваивается ранг на основе различных сигналов и данных.
Вот совокупность этих двух проанализированных метрик и становится основой для решения алгоритма.
Ранжирование собирается таким образом, чтобы сделать метрику качества рекомендаций максимально подходящей для интересов пользователя. Эта метрика показывает, как часто пользователь обращается к кино и насколько долго его смотрит. Результаты подбираются таким образом, чтобы поощрить время просмотра в течение дня (и увеличить количество дней с просмотром в течение недели).
Алгоритм расчета и параметры метрики качества рекомендаций подбираются так, чтобы максимально хорошо соответствовать метрике «интересности сервиса». Правда детального разбора о том, как вычисляется эта метрика, сервис не предоставляет.
Как управлять рекомендациями
Вы можете управлять рекомендациями Кинопоиска сами:
- через свое поведение в течение просмотра (включая досмотры до разных моментов в контенте, не досматривая до конца);
- путем выбора контента на витрине;
- через поиск интересующих тайтлов в поиске;
- проставлением оценок и отметки «не интересно»;
- добавлением тайтлов в избранное.
И, конечно, рекомендации можно просто игнорировать.
Еще всем, у кого есть аккаунт на Яндексе, доступен раздел «Управлять данными» — там можно указать, какие данные передавать в сервис, и узнать, какие данные доступны каждому приложению Яндекса.
Чтобы поменять данные, нужно ввести и подтвердить номер телефона. Когда сервис подтвердит номер, можно будет увидеть, какие данные о ваших действиях есть у каждого сервиса:
Найдите и выберите «Кинопоиск» — теперь можно удалить хранящиеся в нем данные (после этого рекомендации в Кинопоиске перестанут быть релевантными вашим прошлым запросам):
Так можно удалить данные из любого сервиса, представленного на этой странице.
Больше подробностей можно найти в документации Яндекса.
Читайте также:
56 фильмов про маркетинг, рекламу и бизнес