В июле 2025 года группа компаний «Родная Речь» провела конференцию «Код человечности», где были представлены новые разработки IT-направления RoRe TECH. В рамках мероприятия эксперты презентовали результаты одной из разработок, экспериментов с «Синт» (рабочее название) — платформой по созданию синтетических респондентов. В отличие от стандартных языковых моделей, работающих на западных данных, этот инструмент обучается на реальных глубинных интервью с россиянами. Такой подход позволяет точнее отражать мнения наших соотечественников, ценности и потребительские мотивы, а не просто выдавать шаблонные ответы, далекие от российской действительности.
В чем проблема западного ИИ в российских исследованиях
Согласно данным GRIT Insights Practice Report 2025, синтетические респонденты — один из топ-5 инновационных направлений в мировом маркетинге. 44% специалистов в зарубежных исследовательских компаниях уже используют синтетические данные. Но большинство из них продолжают придерживаться стандартного подхода, отправляя нейросети промт с обобщенным описанием персонажа — и получают поверхностные и часто неверные ответы.

Так, например, эксперты провели эксперимент, спросив у 300 синтетических респондентов: «Кто добытчик в семье?». Результат оказался типичным для искусственного интеллекта, обученного на данных государств, где равноправие полов считается нормой: 59% сказали «муж», 46% — «жена», а 100% заявили о том, что «делают это совместно». При этом картина распределения финансовых обязательств по мнению реальных россиян выглядит следующим образом: 71% голосов было отдано за вариант «муж», 27% — «жена», и только 32% опрошенных готовы разделять роль «добытчика». Как мы видим, ответы реальных респондентов заметно отличаются от «синтетических», и самое главное — зарубежные ИИ-модели не понимали контекста, культурных и поведенческих особенностей и истинных ценностей жителей нашей страны. Поэтому их ответы были нереалистичными для российской действительности.

Реалистичные ответы вместо сухих данных: как мы научили ИИ рефлексировать, а не подбирать слова
Чтобы сделать результаты исследований, полученных «синтетическим» путем, похожими на реальные и отражающими ту самую «русскую душу», мы разработали многослойную систему дообучения ИИ. Ее ядро — не только данные западных ИИ-моделей, но также и уникальная база глубинных данных на основе транскриптов реальных интервью с людьми. Такие данные помогают лучше имитировать их поведение и стиль мышления.
Последовательность работы экспериментальной платформы «Синт» состоит из трех шагов:
- Вопрос. Исследователь задает любой, даже самый личный вопрос синтетическому респонденту.
- Анализ. Вопрос проходит через систему «ИИ-экспертов» (агентский роутер), которая подбирает наиболее подходящие данные из массива реальных интервью и дополняют их своей экспертной рефлексией.
- Ответ. Эти данные передаются в языковую модель, которая формирует развернутый ответ в духе конкретного респондента, точно воспроизводя его позицию и мотивацию.

От угадывания ответов к точному пониманию смыслов
Ключевой показатель эффективности наших экспериментов с «Синт» — высокая точность попадания в смыслы и нюансы ответов. После дообучения по специально разработанной методике этот показатель в тестах вырос с 55% до 70−80%.
Яркий пример — ответы «синтетических зумеров» на вопрос «Возвращения каких ушедших из РФ брендов вы ждете?». До обучения искусственный интеллект выдавал случайные популярные названия: Uniqlo, Victoria`s Secret, Massimo Dutti, H&M, OYSHO. И только после дообучения ответы ИИ совпали с реальными ответами россиян-зумеров: ZARA, H&M, Uniqlo, Nike, Adidas. Это подтверждает, что модель стала лучше улавливать паттерны и приоритеты реальных людей, а не просто угадывать ответы.

Вызовы в процессе разработки
Одним из неожиданных открытий стала разная точность синтеза для разных поколений.
- Миллениалы (65% точности): ИИ понимает их лучше всего благодаря большому цифровому следу и высокой интернет-активности с ранних лет.
- Зумеры (55% точности): задача становится сложнее из-за чуть меньшего количества фундаментальных исследований и более короткой и фрагментированной цифровой истории.
- Поколение Альфа (45% точности): наиболее сложная, но самая перспективная аудитория для дальнейшей работы.
Важно отметить, что эти результаты были получены на необученной модели, что подтверждает важность ее дообучения для лучшего понимания молодежи.

Как «Синт» ускоряет проверку гипотез и удешевляет ее
Обучение синтетов обходится в ~ 2,5 млн рублей на один целевой сегмент, поэтому выгодно и эффективно проводить его совместно с другими игроками индустрии и пользоваться уже разработанными сервисами — например, «Синт». Он будет полезен для тестирования гипотез перед запуском рекламных кампаний, разработки сценариев, калибровки идей с помощью «смоделированных» респондентов и уточнения нюансов коммуникации с целевыми группами. Технология обеспечивает круглосуточный доступ к любой аудитории, позволяет получать ответы на любые, даже самые сложные и интимные вопросы, которые люди не всегда готовы честно обсуждать с интервьюером-человеком, а также использовать сервис в качестве инструмента для быстрой первичной аналитики и проверки гипотез перед большим полевым этапом.

При этом в компании не пропагандируют, что ИИ-респонденты — это полноценная замена людям. Мы видим их в качестве нового мощного инструмента в арсенале исследователя, который позволяет работать быстрее и глубже.
Проект «Синт» задуман как открытая инициатива для индустрии: команда RoRe TECH приглашает исследовательские агентства и компании объединить усилия для дальнейшего развития методологии. Совместная работа позволит нам создать и масштабировать целую «армию» синтетов, индустриально обучая их на нашем технологическом стеке. Это даст нам доступ к универсальному инструменту для исследований 24/7.

