Команда исследователей из Института Стивенса (Нью-Джерси, США) впервые описала работу ботов в наиболее крупном, англоязычном сегменте «Википедии». Ученые сосчитали, что их в максимуме было 1601 штук, что они делятся на 9 групп по своему функционалу, что на них приходится 10 % всей активности на сайте энциклопедии, а в некоторых отделах – например, в Wikidata – до 88 %.
Большая часть ботов занимается исправлением ошибок, и они внесли уже 80 миллионов правок. Исследование, опубликованное в издании Proceedings of the ACM on Human-Computer Interaction в ноябре 2019 года, наглядно показывает, какую мощь представляют собой роботы в работе над контентом сайта, и насколько они влиятельны. Скажем, было установлено, что если новых участников онлайн-сообщества «Википедии» приветствуют и напутствуют боты, то они более длительное время принимают участие в проекте – по сравнению с теми, кого встречают редакторы-люди.
Джеффри Никерсон, один из авторов научной работы, профессор Школы бизнеса в Институте Стивенса, заявил прессе: «ИИ меняет способ, при помощи которого мы производим знания, и «Википедия» является идеальным местом для изучения этого процесса. В будущем мы все будем работать совместно с искусственным интеллектом, и исследования вроде нашего помогут превратить ботов в более эффективные инструменты».
Произвести научные изыскания стало возможным, потому, что «Википедия» прозрачна, в отличие от других крупных проектов, в работу которых вовлечены как люди, так и ИИ. Авторы исследования использовали алгоритмы классификации ботов, чтобы понять их функции. Наиболее распространены роботы, которые восстанавливают испорченный контент или удаляют последствия вандализма («фиксаторы»); боты, делающие перелинковку страниц («соединители»); боты-«защитники», которые борются с неадекватным поведением некоторых пользователей энциклопедии, и роботы-«советники», предлагающие участникам сообщества советы и новые виды деятельности.
«Фиксаторов» на платформе работало в разное время до 1200 штук. Роботы-«советники» и «защитники» не так распространены, но играют жизненно важную роль во взаимодействии редакторов с «Википедией». Мы уже рассказывали, что поведение «советников» подталкивает людей-редакторов тратить больше времени на проект.
Добавим, что люди готовы вносить свой вклад дольше и тогда, когда роботы связываются с ними, чтобы указать на сделанные ошибки или даже удалить их работу. Такое стало возможным, потому что боты «сердечны», они вежливо и ясно объясняют людям, почему те или иные статьи или правки не могут быть опубликованы.
Авторы исследовании даже заявили, что «Механизмы прозрачности и обратной связи «Википедии» помогают людям принимать ботов в качестве законных членов сообщества».
Понять, как работают роботы в открытом проекте, и применить в бизнесе
Джеффри Никерсон уверен, что исследование роботизированных систем управления и обратной связи, возникших в энциклопедии, позволит коммерческим сайтам и создателям ботов извлечь для себя некоторые уроки:
«То, что мы видим в «Википедии», может стать предвестником возникновения многих отраслей и профессий. Изучая ее, мы можем научиться создавать инструменты ИИ, которые улучшат как нашу производительность, так и качество нашей работы».
Рассмотрим чуть подробнее, чем же занимаются 9 видов ботов в «Википедии»:
- «Генераторы». Эти боты создают контент для сайта – страницы и их части, основываясь на заранее определенных шаблонах. Например, они генерируют страницы перенаправления и статьи, построенные на контенте из других источников. Самый первый робот «Википедии» Rambot создавал статьи об американских городах, пользуясь данными переписи населения.
- «Фиксеры» исправляют битые ссылки, убирают двойные редиректы, правят опечатки и орфографические ошибки. Или могут, скажем, проверять и исправлять данные о датах рождения и смерти в биографических статьях.
- «Соединители» устанавливают связь «Википедии» с другими сайтами и базами данных; извлекают оттуда информацию и помещают ее в WikiData; связывают между собой статьи; добавляют к публикациям идентификаторы – например, научных статей (DOI) или книжные (ISBN); связывают между собой одинаковый контент, опубликованный на разных языках.
- «Теггеры» непрерывно «патрулируют» статьи и их теги, чтобы корректно увязывать страницы с категориями.
- «Клерки» обновляют статистику, документируют статус участников проекта, доставляют оповещения, собирают статистику в индекс, который показывает важность и уровень качества всех статей.
- «Архиваторы» обеспечивают сохранение закрытых обсуждений, сортируют архивы, удаляют данные из «песочницы» и т. д.
- «Защитники» находят следы деструктивного поведения пользователей, удаляют их, фильтруют спам, фиксируют нарушения политики «Википедии», пресекают вандализм и даже способны противостоять вредоносным изменениям, которые делаются с использованием сторонних «нейронных» сетей. Защитники могут заметить вандализм и восстановить испорченное содержание за несколько секунд. Есть даже боты, которые отслеживают потенциальные конфликты интересов у редакторов статей.
- «Советники» сообщают редакторам, какой вклад они могут сделать в «Википедию». Например, собирают новые научные статьи о явлениях, которые стоит описать, и формируют списки – например, «недостающие научные темы».
- «Уведомители» занимаются тем, что доставляют сообщения редакторов, информационные бюллетени о последних событиях в «Википедии» – например, уведомления рецензентам о том, что появились новые статьи, которые требуют внимания, и т. д.
Боты конкурируют между собой, многие выводятся из обращения. Постоянно создаются новые, все более сложные боты, которые наоборот внедряются. С 2009 года количество задействованных в «Википедии» ботов постоянно снижается, однако число правок, которые роботы вносят, почти не уменьшается.
Авторы научной работы определили, что 9 видов ботов выполняют 25 функций. Однако об эволюции ботов, о том, как они эти функции выполняют в подробностях, пока судить не могут. Сообщается, что это тема будущих исследований.
Экосистема роботов «Википедии» может стать образцом для понимания роли ИИ в создании и поддержании крупных контентных проектов. Скажем, пример энциклопедии вдохновляет на то, чтобы улучшать условия труда людей, перепоручая рутинные функции ботам. Также боты лучше справляются с проверкой точных данных, отлично извлекают их из сторонних баз. Даже тегирование и перелинковка контента на сайте может быть доверена ботам. И это хорошая весть для редакторов-людей.