Недорого и тайно предсказывать общественное мнение – вот чего хотят большой бизнес и политики в том «завтра», которое нас всех неминуемо ожидает. И, похоже, скоро у них это получится. Потому что мы в ежедневном режиме (часто неосознанно) вываливаем в соцсети крайне важный массив информации о себе. Осталось лишь научиться ее обрабатывать.
Свежее исследование группы ученых из Университета Эдинбурга (Шотландия), опубликованное в виде препринта на arXiv.org, показывает, что это возможно, причем с высокой эффективностью.
«Текстерра» нашла научную работу «Оценка настроения выраженной позиции в социальных сетях», которая появилась в августе 2019 года. Она ясно говорит о том, что по поведению пользователей в соцсетях не так уж и трудно предсказывать их аргументированное мнение практически по любому вопросу.
Более ранние исследования строились на предположении о том, что позицию пользователей соцсетей в отношении того или иного события (или утверждения) можно предсказать по их эмоциональным реакциям, выраженным по поводу уже произошедших, похожих событий или уже обсуждавшихся похожих проблем.
Однако исследователи Абир Альдаэль и Валид Магди из Эдинбурга на примере Twitter показали, что нужно учитывать не только эмоциональные реакции, но и сетевые взаимодействия людей – их комментарии, репосты, размещение ссылок и так далее.
Научная работа обращает внимание на то, что при обсуждении любой темы, негативные настроения всегда выражаются чаще. Люди привыкли использовать «плохие чувства», чтобы высказать свое мнение.
Например, 59 % пользователей Twitter считают, что изменение климата на Земле на самом деле происходит. Но при этом негативные высказывания об этом утверждении делают 50 % пользователей.
30 % твитов о представителях ЛГБТ-сообщества по настроению негативны. Но лишь 7 % пользователей соцсети имеют на самом деле аргументированную позицию «противников ЛГБТ».
В среднем 54–56 % твитов (в зависимости от методики подсчета) вообще по любому поводу будут негативными.
Поэтому ученые применили более точный, комплексный подход предсказания общественного мнения, нежели только «отслеживание эмоций» – способ с использованием сигналов интерактивного взаимодействия участников соцсетей.
Как именно исследователи смогли угадывать мнение обитателей Twitter
Абир Альдаэль и доктор Магди использовали популярную технологию семантической оценки текста SemEval на выборке из 4 000 твитов, а также три ключевых фактора сетевого взаимодействия людей.
Первый – это «сети взаимодействия», которые включают в себя аккаунты Twitter и веб-домены, с которыми пользователи как-либо взаимодействуют, или цитируют сообщения с них в своих твитах.
Второй фактор называется «сетью предпочтений», он состоит из косвенных взаимодействий с другими учетными записями и веб-доменами – например, из нажатий кнопки «нравится». Третий фактор именуется «сетью соединений» и включает в себя список всех аккаунтов, на которые пользователи из выборки подписаны, и аккаунтов, которые подписаны на них самих.
Ученые пояснили журналистам, что названные сетевые факторы не зависят от того, как пользователи выражают свою позицию по отношению к какой-либо теме, то есть от содержания пользовательских постов. Эти факторы могут рассказать о том, что пользователь думает на самом деле. Тем они и интересны для анализа.
Результаты, полученные исследователями, позволяют предположить: позиция пользователя по тому или иному вопросу может быть выяснена путем анализа нескольких аспектов его онлайн-активности.
Анализ трех вышеназванных факторов дал исследовательской группе шанс достичь той же производительности и уровня достоверности, что есть у технологий семантической оценки текстов (SemEval, например).
А комплексный подход с применением SemEval позволил угадывать позицию пользователей по тому или иному вопросу в 72,49 % случаев. Это рекорд на сегодняшний день. И рекорд очень пугающий.
Авторы научной работы подчеркивают, что анализ функций сетевого взаимодействия участников соцсетей способен предсказывать их мнение по поставленной проблеме, даже если они прямо о ней никогда не высказывались.
Чем все это грозит
В будущем наблюдения, собранные учеными, могут послужить для создания аналитических «сервисов угадывания общественного мнения». Cкорее всего, они будут непубличными.
Если утрировать, то бизнес сможет без опросов, без шума и общественного контроля, выяснить ваше отношение, скажем, к прозрачным мини-юбкам. А затем, таргетировать на вас их душевную рекламу. Это будет сравнительно безобидная, хоть и сомнительная сфера применения новых методов анализа пользовательских воззрений. Она бы взорвала сегодняшний digital-мир и вывела бы продвижение в социальных сетях на новый уровень.
А вот если политики захотят, например, «потестить» идею введения крепостного права для всех малоимущих? Или идею отправки представителей ЛГБТ на урановые рудники? Ведь они получат возможность сделать это совершенно тайно. Представляете, какие законопроекты могут возникнуть в результате?
Появление научной работы «Оценка настроения выраженной позиции в социальных сетях» – это своего рода сигнал для их увлеченных пользователей: «Вас могут использовать так тихо и незаметно и при этом так всеобъемлюще, что завтра вы можете проснуться в совершенно другом мире. И не сказать, что этот мир окажется лучше, чем был».
Теперь у нас есть отдельная рассылка в ВК для новостей из мира digital. Собираем самое интересное и делимся – честно и без дешевого хайпа. Присоединяйтесь!