Специально для платформы SocioLogos.ru руководитель Экспертного совета Экспертного института социальных исследований (ЭИСИ) Глеб Сергеевич Кузнецов рассказал о роли искусственного интеллекта в социологии.
Большие языковые модели (LLM) представляют собой тип генеративного ИИ. который анализирует отношения между словами и фразами. Пройдя обучение на больших массивах данных, такой ИИ хорошо справляется с написанием эссе, выполнением перевода, составлением резюме текста и т.д. Но LLM не только выдают наиболее распространенные словосочетания, они также способны имитировать ответы людей, принадлежащих к отдельным социальным группам (по полу, национальности, социально-экономическому классу. политическим предпочтениям и т.д.). Эта способность ИИ была сразу замечена социологами, которые предположили, что модели можно использовать для проведения соцопросов. Поскольку они хорошо имитируют типичные ответы респондентов с заданными характеристиками, одна такая модель может заменить целую репрезентативную выборку.
В одной из опубликованных работ ученые из Стэнфорда и Университета Нью-Йорка обучили LLM на массиве из 70 опросов жителей США, включавших в себя 105 165 участников. По словам авторов, цель обучения состояла не в том, чтобы напрямую предсказывать результаты, а в моделировании реакций людей, относящихся к определенным демографическим подгруппам. Коэффициент корреляции может быть от 0 до 1, где 0 означает полное отсутствие корреляции, а 1 - 100% корреляцию. ИИ продемонстрировал достаточно высокий результат - 0,85. Когда авторы протестировали модель на новых данных, которые не входили в обучающий материал, коэффициент корреляции оказался даже выше - 0,9. Несмотря на вполне обоснованную критику и ограничения – тема “социология без респондента” – демонстрирует свою жизнеспособность уже сегодня, когда LLM только выходят из пеленок “науки” в область практически используемой технологии.
Уже сейчас существует множество проектов из различных сфер общественных наук. которые используют это свойство моделей.
В академической социологии с помощью LLM не только прогнозируют результаты соцопросов, но и:
● имитируют социальные эксперименты
● отслеживают изменения в обществе по формулировкам в СМИ и соцсетях
● создают модели, которые прогнозируют изменения в социальном поведении и демографии
● исследуют отношение общества к отдельным явлениями. проблемам или политике и т.д.
Но чаще всего ИИ этого типа используется в маркетинге. Обработка естественного языка (Natural Language Processing) позволяет определить отношение целевой аудитории к отдельным продуктам и выявить их недостатки. Существуют десятки компаний. предлагающих собственные модели для бизнеса, которые имитируют предпочтения людей из различных групп.
При этом здесь также есть целый ряд отдельных подходов. Например, Poll the People - это платформа на основе ChatGPT, позволяющая моделировать ответы более чем 500 тыс. человек. Проект Conveo специализируется на качественном анализе интервью, отзывов в видео-формате и других материалов, формируя портрет клиента и его потребности. Компания Yabble, сотрудничающая с разработчиком ChatGPT OpenAI, собирает тысячи реальных отзывов на различные продукты, а затем анализирует и классифицирует их, предоставляя заказчикам отчет о потенциальных проблемах. которые могут возникнуть с ними.
Еще одно перспективное направление использования ИИ, в последние годы набирающее все большую популярность - предвыборные кампании. Наиболее часто используются LLM, прогнозирующие результаты выборов и предсказывающие реакцию избирателей на определенные изменения. Например. алгоритм KCore Analytics применялся для моделирования результатов выборов во многих странах, включая США, Бразилию, Аргентину, Индию и Кипр. Не все ИИ опираются на материал реальных опросов, некоторые обучаются на постах в соцсетях и предсказывают успех кампании по политической активности пользователей. Один из таких примеров – Polly - ИИ, анализирующий соцсети.
LLM могут выполнять и другие задачи. Так. британская компания Campaign Lab создала модель, которой можно задавать характеристики людей (пол. возраст. партийная принадлежность и т.д.) и которая будет реагировать в соответствии с ними. Цель этого проекта - научить волонтеров взаимодействию с людьми различных социальных групп. Но некоторые компании используют ИИ даже для того. чтобы собирать отзывы реальных респондентов. Например, AI Pollster от SignalWire - приложение, использующееся для опросов живых людей в предвыборной кампании США 2024 г. ИИ прозванивает внесенные в базу номера телефонов, задает заранее выбранные вопросы, затем записывает и обрабатывает ответы.
ИИ для предсказания итогов голосования применяются уже несколько лет. Например, алгоритм KCore Analytics спрогнозировал победу Байдена в 2020 г. с небольшим перевесом в коллегии выборщиков. ИИ от Expert.AI для отслеживания настроений в соцсетях показал, что вероятность победы Байдена - 50,2%[1].
Однако путь к успеху больших языковых моделей отнюдь не усеян розами. И проекты в этой области сталкиваются с большим количеством проблем, ограничений и даже неудач.
Первой из проблем применения ИИ для моделирования результатов социсследований заключается в низком доверии к нему со стороны общества. Одно дело читать про то, что ИИ достиг каких то супервысот в повышении производительности труда где-нибудь в сложных математико-технологических историях, а другое – что он легко заменяет тебя, имярек, полностью моделируя политические предпочтения, потребление, эмоции, чувства и так далее. В это просто не хочется верить, а если уж поверил – внутри даже лояльных к технологиям страт начинают шевелится внутренние луддиты.
Среди других проблем:
● склонность LLM к т.н. “галлюцинациям”, т.е. фактическим ошибкам
● проблема “черного ящика”: невозможность отслеживать, почему и каким образом ИИ пришел к определенному выводу
● проблема воспроизводимости исследования: можно получить два разных ответа на один вопрос, заданный в разное время одной модели
● ИИ воспроизводит все стереотипы и предубеждения. существующие в человеческом обществе
● смоделированные опросы обладают теми же недостатками, что и настоящие: например. в них часто не представлены люди, которые живут в отдаленных районах и не всегда имеют доступ в Интернет
● ограниченный объем материала для обучения LLM. которое требует огромных баз данных
Несмотря на существующие проблемы, моделирование соцопросов с помощью ИИ является перспективным направлением. Главная причина в том, что в последние десятилетия центры по исследованию общественного мнения сталкиваются со снижением числа респондентов, готовых отвечать на вопросы. Так, Pew Research сообщает, что в 1997 г. поучаствовать в исследовании соглашалось 36% людей, которым они звонили, но к 2018 г. их число сократилось до 6%[2]. Как следствие, даже авторитетные компании могут скоро обратиться к ИИ-опросам. Другими причинами являются простота, низкая стоимость и скорость проведения таких исследований: если раньше позволить себе массовые опросы могли только крупные компании, сейчас они доступны даже малому бизнесу или политическим кампаниям с небольшим финансированием. То же касается и науки. Здесь использование ИИ снижает входной порог требований к специалистам: например, исследования, которые раньше проводились только социологами, обладающими обширными знаниями о методах, теперь доступны студентам, а в перспективе – и любым желающим, включая мало понимающим в социологии HR-специалистам, бизнес-стратегам или маркетологам.
[1] https://indiaai.gov.in/article/ai-pollsters-are-here-and-here-s-how-they-performed-in-the-us-electio...
[2] https://ash.harvard.edu/articles/using-ai-for-political-polling/