Читаем без скачивания Новые боги. Как онлайн-платформы манипулируют нашим выбором и что вернет нам свободу - Кристиан Монтаг
Шрифт:
Интервал:
Закладка:
Я и социальные сети
В начале главы я уже упомянул две работы, лежащие в основе психоинформатики. Помимо них, нельзя не упомянуть работу Михала Косински 2013 года[294]. Кстати, она сыграла важную роль в скандале с противозаконным использованием данных Cambridge Analytica: компанию обвинили в том, что она якобы манипулировала сознанием миллионов избирателей через соцсети во время кампании Leave.EU и президентских выборов в США (Хиллари Клинтон против Дональда Трампа). Я прочитал много публикаций об этом крупном скандале, в который была вовлечена компания Facebook Inc., и мне кажется, что всей правды мы никогда так и не узнаем. Несмотря на изложенные в книге «Mindf*ck» разоблачителя Кристофера Уайли доказательства[295], все еще невозможно подсчитать, сколько избирателей не пришло на выборы или проголосовало за выход Великобритании из ЕС из-за этих манипуляций (которые, безусловно, имели место)[296]; в английском языке это явление получило название «подавление избирателей» (voter suppression). По этой причине мне хотелось бы подробно разобрать, как с точки зрения психоинформатики на самом деле может выглядеть манипуляция пользователями через социальные сети.
Отправной точкой для моих дальнейших рассуждений станет научная работа Михала Косински и его коллег, в которой впервые были озвучены некоторые методы, позднее применявшиеся Cambridge Analytica. Здесь важно сразу отметить, что сам Косински не имел отношения к скандалу с незаконным использованием данных Cambridge Analytica. Тем не менее он, похоже, хорошо осознает далеко идущие последствия своего исследования. В интервью швейцарской газете Das Magazin Косински отметил: «Я лишь показал, что бомба замедленного действия существует»[297]. Но как именно она устроена?
Лично мне всегда легче понять научную работу в области психологии или нейронауки, если я ненадолго ставлю себя на место испытуемых, так что попробую «поучаствовать» в знаменитом эксперименте Косински. Итак, в качестве участника исследования со мной могло бы произойти следующее: сначала я бы получил сообщение в фейсбуке от рабочей группы Михала Косински с рекламой исследования под названием MyPersonality. Поскольку меня очень занимает тема личности, я бы с удовольствием принял участие в личностном тесте и заполнил бы онлайн-анкету. Хороший способ привлечь как можно больше людей – предложить им обратную связь, чтобы они узнали что-нибудь новое о себе. Звучит банально, но, если человек проходит анкету, значит, существуют и определенные критерии для оценки полученных результатов. Так что в качестве благодарности за участие в исследовании мне могли бы прислать разбор структуры моей личности. Например, сообщили бы, что я набрал 10 из 20 возможных баллов по параметру «экстраверсия». Поскольку не существует определенных границ «сильной экстраверсии» (или, наоборот, «сильной интроверсии»), группа ученых, с которой работаю я, в качестве обратной связи предпочитает отправлять участникам не только их результаты, но и данные по большим выборкам, которые позволят им сравнить свои результаты с результатами других людей.
Другой способ привлечь к исследованию побольше народа – заплатить каждому участнику. На мой взгляд, это худший вариант: не только потому, что он гораздо дороже, но и потому, что может пострадать качество данных. Вдруг кто-то примет участие в исследовании только «для галочки», чтобы заработать?
Для научного исследования Михала Косински удалось привлечь 58 466 человек: они не только заполнили онлайн-анкеты, но и позволили ученым соотнести эти данные с информацией из их профилей в фейсбуке. Такое количество респондентов заслуживает отдельного упоминания: многие исследования в области психологии сталкиваются с проблемой небольших выборок, которые часто состоят сплошь из жителей так называемых WEIRD-обществ (см. главу 2)[298]. Похоже, здесь нам наконец поможет психоинформатика: она позволяет работать с надежными выборками и привлекать разные группы людей[299].
После успешного сбора данных Михал Косински и его коллеги сосредоточились на изучении лайков, которые испытуемые ставят в фейсбуке, чтобы сделать прогнозы относительно их анкет. Ученые хотели определить, насколько хорошо отметки «Нравится» позволяют судить о социально-демографических переменных, таких как возраст и пол, и о психологических, вроде характера или уровня интеллекта. Почему именно лайки? Они содержат релевантную информацию о пользователях, поскольку люди обычно лайкают только то, что им действительно нравится. Таким образом пользователи фейсбука добровольно показывают операторам платформы, что им по душе, а что нет. Meta извлекла из этой информации немало прибыли. По схожему алгоритму работал Косински: на основании оставленных пользователями лайков его команда отбирала общие паттерны поведения, которые позволяли ученым строить гипотезы о характеристиках участников и относить их к той или иной категории. Приведу пример (не из исследования), который наглядно показывает, как может выглядеть отбор. Представим, что из комментария под постом в фейсбуке я узнал, что Нил Янг скоро выступит с концертами в Европе, а в другом комментарии прочел, что у Тейлор Свифт выходит новый альбом. Я бы лайкнул оба сообщения. На основании этого меня можно отнести в категорию «Любитель музыки». Такая категоризация, конечно, приводит к упрощению данных, но одновременно помогает лучше их отсортировать и проанализировать. Статистический анализ в работе Косински ожидаемо показал, что большее количество доступных для анализа лайков привело к повышению точности прогнозов по целевым переменным. Чем больше цифровых следов было доступно, тем легче авторам исследования было предсказать многочисленные психологические переменные. Но насколько точна эта информация?
Для начала отметим, что при проведении статистического анализа на одного пользователя в среднем приходилось около 170 лайков. Этого было достаточно для выявления дихотомических переменных – переменных из двух категорий, например пол (мужчина/женщина)[300]. В США политическая ориентация также была бы дихотомической переменной, так как, в отличие от Германии, там двухпартийная система (демократы против республиканцев). Еще один пример – употребление алкоголя (да/нет). Но вернемся к лайкам в фейсбуке и их предсказательной силе. Мужчину можно отличить от женщины на основе лайков с точностью 93 %. Также алгоритм смог правильно (85 %) классифицировать либералов и консерваторов. Точность определения сексуальной ориентации человека (гетеросексуал или гомосексуал) составила 88 % среди мужчин и 75 % среди женщин.
Как и в исследовании Гокула Читтаранджана, команда Косински попыталась описать структуру личности на основе данных смартфона. В лучшем случае предсказательная сила информации о лайках участников исследования составила 0,40 для показателя «экстраверсия» и 0,43 для личностной черты «открытость опыту». Здесь точность прогнозирования значительно снижается, так как речь идет не о дихотомических переменных, а о метрических конструктах. К метрическим конструктам относятся не только рост и вес человека, но и характер, который оценивается совокупностью целого ряда критериев.
Несмотря на более низкую предсказательную силу, все же удалось обнаружить умеренные корреляции между лайками и чертами