На Грушинской конференции мы провели мастер-класс на площадке ВЦИОМ. Сергей Проценко показал, как строить системный пайплайн качественного анализа с нейросетью - и зал, мягко говоря, оживился. Потому что большинство из нас уже «балуются» с ИИ, но делают это интуитивно, почти вслепую.
Эта статья - попытка передать суть того, что прозвучало за чуть больше чем час. Без воды, с конкретикой.
Проблема не в ИИ. Проблема в том, как мы его используем
Типичная история: берёшь транскрипт интервью, кидаешь в ChatGPT, пишешь «сделай вывод». Модель что-то гладко выдаёт. Кажется, работает.
Но попробуй сделать то же самое ещё раз — получишь другой ответ. Попробуй проследить, на каких конкретно цитатах основан вывод — не сможешь. Попробуй масштабировать это на 12 или 20 интервью — сломается.
Это и есть «магия ИИ»: выглядит убедительно, но воспроизвести и проверить нельзя. Для академического и прикладного исследования это катастрофа.
Пайплайн — это не конвейер, это архитектура
Сергей предложил другую логику: не «отдать интервью ИИ», а выстроить цепочку шагов, где результат каждого этапа становится точным входом для следующего.
Звучит технически, но на практике это просто: один шаг - одна операция.
Сначала извлекли релевантные фрагменты. Потом присвоили коды. Потом сгруппировали. Потом сделали кросс-анализ. Не всё одним запросом - последовательно, с контролем между шагами.
Это принципиально меняет роль исследователя. Ты не «пользователь чат-бота» - ты архитектор процесса. Именно ты решаешь, что и в каком порядке делает модель, и проверяешь результат на каждом шаге.
Что отдаём ИИ, а что остаётся за исследователем
Здесь важно быть честными. Есть операции, которые ИИ делает хорошо и быстро: извлечение цитат по заданным критериям, присвоение кодов и группировка фрагментов, поиск повторяющихся паттернов, черновая структуризация отчёта, сводные таблицы по большому массиву данных.
И есть то, что остаётся за исследователем - и должно оставаться: постановка аналитических вопросов, выбор теоретической рамки, интерпретация противоречий и единичных мнений, итоговое объяснение: «почему так, а не иначе».
Ирония, подтекст, пауза в голосе - это модель не считывает. И это нормально. Задача не в том, чтобы заменить исследователя, а в том, чтобы освободить его от 60–70% механической работы.
Для демонстрации взяли реальный массив: 12 интервью с модераторами фокус-групп из архива Сергея Белановского. Задача - понять, как профессионалы видят групповую динамику, роль модератора, в каких задачах фокус-группа уместна, а в каких нет.
Пайплайн работал так: сначала ИИ помогает сформулировать исследовательские вопросы и выстроить гайд анализа. По каждому интервью - таблица ответов на 25 вопросов с привязкой к цитатам и к конкретному респонденту. Из 25 выбираются 5–6 самых «плотных» - там, где данных больше всего и есть что анализировать.
По каждому вопросу - таблица цитат и тезисов, затем кросс-анализ: паттерны, противоречия, пробелы, возможные сегменты. На выходе - предварительные выводы на десятки страниц, которые исследователь уже дочищает и уплотняет.
Важный принцип, который Сергей особо подчеркнул: если в интервью нет данных по вопросу - модель должна честно писать: «нет данных», а не додумывать. Это закладывается в промт. Это часть архитектуры.
На конференции у нас было чуть больше часа. Сергей успел показать общую архитектуру и кусочек живой демонстрации на реальных данных. Этого хватило, чтобы стало понятно: это работает, и это не магия.
Но часа, конечно, мало, чтобы собрать свой рабочий пайплайн.
Поэтому есть курс - где мы разбираем это уже в формате практики: шаблоны промтов, структурированные таблицы, организационные вопросы (API, закрытый контур, локальные модели). И главное - каждый участник уходит со своим пайплайном под свои задачи.
Курс для тех, кто работает с качественными данными: исследователей, аналитиков, модераторов, социологов - всех, кто хочет сократить механическую рутину и не потерять глубину анализа.
Если откликается - напишите нам напрямую вышлем программу и все детали.
А полную запись МК можно посмотреть на Рутубе: Запись
Telegram: t.me/dina_highresult