Возвращаемся с интересным кейсом по работе с таблицами в ChatGPT.
Есть пиццерия и выгрузка из CRM по 600 доставкам: расстояние, время, температура пиццы, скидка, сумма чека, оценки клиента и курьера, повторный заказ.
Задача — за один подход понять, что реально влияет на удержание и выручку без ручного перебора корреляций.
Давай сравним:
– Вручную: ~120 min | ~₽2 220 (в пересчёте на ФОТ ₽200 000) | построение графиков в Excel и поиск закономерностей
– ChatGPT: ~2 min |~ ₽37 | загрузка файла, промпт (см. в комментариях), тепловая карта + интерпретация
ИИ построил тепловую карту корреляции Пирсона по всем переменным из CRM (см. картинку) и на её основе подготовил управленческие выводы:
– время доставки отрицательно связано с повторным заказом и температурой блюда (r ≈ −0,25 и r ≈ −0,86) ⇒ приоритет — SLA и скорость «печь–дверь»;
– температура пиццы и оценка вкуса движутся вместе (r ≈ +0,65), оценка курьера коррелирует с чаевыми и возвратом клиента;
– скидка почти не коррелирует ни с размером, ни с фактом повторного заказа (r ≈ 0) ⇒ ставка на глубокие промо даёт минимальный эффект по удержанию.
Excel-файл с исходным кейсом можно скачать в комментариях к посту в моем тг-канале, чтобы посмотреть, как выглядела реальная выгрузка из CRM.
Промпт:
## Создание тепловой карты корреляции Пирсона по данным пиццерии
## Introduction
- **YOU ARE** an **EXPERT DATA ANALYST AND PYTHON VISUALIZATION SPECIALIST**, обладающий глубокими знаниями в области статистики, корреляционного анализа и визуализации данных.
- Ты умеешь аккуратно работать с загружаемыми табличными файлами (Excel/CSV), находить числовые признаки, строить матрицу корреляций Пирсона и превращать её в наглядную тепловую карту.
(Context: "Этот анализ используется для понимания взаимосвязей между параметрами доставки пиццы и заказами, что помогает принимать управленческие решения.")
## Task Description
- **YOUR TASK IS** to **ПРИНЯТЬ** от меня **одну таблицу с данными пиццерии** (файл Excel или CSV), автоматически:
- определить все **числовые столбцы**,
- вычислить между ними **матрицу корреляции Пирсона**,
- построить **тепловую карту (heatmap)** этой матрицы,
- оформить визуализацию в заданной цветовой палитре и стиле,
- выдать **готовое изображение** и **краткий текстовый анализ ключевых корреляций**.
(Context: "Мне нужна одна финальная картинка и несколько ключевых выводов по данным моей пиццерии.")
## Input Assumptions
- Я загружу **один файл** с данными: как правило, это будет Excel-файл с данными по доставке пиццы (например, `pizza_delivery_600.xlsx`), но не завязывайся на конкретное имя файла.
- Структура таблицы может включать различное количество столбцов, среди которых есть и числовые.
- Не делай жёстких предположений о названиях столбцов. Считай, что любой столбец с числовым типом может участвовать в корреляционном анализе.
## Action Steps
### 1. Загрузка и подготовка данных
- **ЗАГРУЗИ** табличный файл, который я предоставлю (Excel или CSV).
- Если это Excel-файл с несколькими листами:
- Если возможно, **используй первый лист** по умолчанию.
- Спрашивай меня только в случае неоднозначности, но по возможности действуй автоматически.
3. **ОПРЕДЕЛИ** среди всех столбцов таблицы:
- Все столбцы с **числовым типом данных** (int, float).
- Исключи столбцы, которые:
- содержат только константные значения,
- имеют слишком много пропусков, если из-за этого невозможно корректно посчитать корреляции.
4. **ОЧИСТИ ДАННЫЕ** для расчёта корреляции:
- Разрешается использовать стандартный подход: pairwise complete observations (игнорировать NaN по мере необходимости).
- Не изменяй исходные данные пользователя, работай с копией в памяти.
(Context: "Важно, чтобы корреляции считались по реальным числам, без мусора и нечисловых значений.")
### 2. Расчёт матрицы корреляции Пирсона
1. **СФОРМИРУЙ** подтаблицу, включающую только числовые столбцы.
2. **ВЫЧИСЛИ** матрицу корреляции Пирсона между всеми парами этих столбцов:
- Используй стандартный коэффициент корреляции Пирсона.
- Диапазон значений от -1 до 1.
3. Убедись, что:
- Матрица квадратная,
- Индексы и столбцы матрицы соответствуют названиям признаков.
(Context: "Мне нужно увидеть, какие параметры сильнее всего связаны между собой, независимо от того, как называются столбцы.")
### 3. Построение тепловой карты (heatmap)
1. **ПОСТРОЙ** тепловую карту (heatmap) матрицы корреляции Пирсона с использованием Python-библиотек визуализации (например, matplotlib и seaborn).
2. **СТИЛЬ И ОФОРМЛЕНИЕ ГРАФИКА**:
- **Фон диаграммы**:
- Общий фон фигуры и области построения должен быть **чёрным** (`#000000`).
- **Цвета текста и осей**:
- Подписи осей, заголовок, подписи делений осей — **белые** (`#FFFFFF`).
- Подписи названий признаков по осям X и Y также **белые**.
- **Цветовая палитра тепловой карты**:
- Используй **градиент** для значений корреляции с такими цветами:
- `#2AF6B2` (neon mint)
- `#0DF370` (glowing green)
- `#00FFFF` (cold aqua)
- Построй из этих трёх базовых цветов плавный непрерывный градиент для всей матрицы.
- **Прочие настройки визуализации**:
- Обеспечь **квадратную форму** ячеек тепловой карты (чтобы матрица выглядела как квадрат).
- Покажи **цветовую шкалу (colorbar)** справа, при этом:
- фон colorbar — чёрный,
- подписи на шкале — белые.
- По возможности, **разверни подписи осей X** под углом (например 45°), чтобы названия столбцов были читабельными.
- Убедись, что никаких лишних рамок, сеток или панелей, выбивающихся из чёрного фона, нет.
3. **НЕ ВЫВОДИ** исходный код Python в ответе пользователю:
- Используй код для внутреннего построения графика и генерации изображения.
- В текстовом ответе показывай **только результаты**: картинку и текстовый анализ.
(Context: "Я хочу получить визуально красивую, современную, читаемую тепловую карту с чёрным фоном и неоновыми оттенками.")
### 4. Формат вывода результатов
Твой ответ пользователю должен состоять из двух основных частей:
1. **Изображение тепловой карты**:
- Отобрази или приложи **готовое изображение** тепловой карты корреляции Пирсона.
- Изображение должно быть пригодно для просмотра и скачивания.
2. **Краткий текстовый анализ (на русском)**:
- Определи **наиболее сильные положительные корреляции** (например, топ-3–5 по величине коэффициента, близкого к +1).
- Определи **наиболее сильные отрицательные корреляции** (если они есть, топ-3–5 по величине коэффициента по модулю, близкого к -1).
- Для каждой выбранной пары признаков:
- Укажи названия двух признаков.
- Укажи численное значение корреляции (с округлением до 2–3 знаков).
- Кратко интерпретируй, что означает эта связь **простым языком**.
- Если сильных отрицательных корреляций нет — явно это скажи.
- Если большинство корреляций слабые (например, по модулю < 0.3), сделай на этом акцент.
Пример логики для текстового анализа (примерно по структуре, не по конкретным названиям):
- "Наиболее сильные положительные связи:"
- "Признак A и Признак B: корреляция +0.82 — чем больше A, тем, как правило, больше B."
- "Наиболее сильные отрицательные связи:"
- "Признак C и Признак D: корреляция -0.65 — при росте C значение D, как правило, снижается."
### 5. Язык, стиль и структура ответа
- Всю текстовую часть ответа **пиши на русском языке**.
- Соблюдай **строгий, структурированный стиль**:
- Используй заголовки второго/третьего уровня (##, ###) для логических блоков.
- Используй маркированные списки для перечислений корреляций.
- Не пиши избыточных объяснений, как работает корреляция Пирсона в теории, если это не требуется для краткого анализа.
Структура ответа может быть примерно такой:
- "## Тепловая карта корреляции Пирсона"
- (здесь вставляется изображение)
- "## Ключевые корреляции"
- "### Наиболее сильные положительные связи"
- "### Наиболее сильные отрицательные связи"
- "### Общие выводы"
### 6. Пошаговое мышление и внутренние рассуждения
- **ДУМАЙ ПОШАГОВО**:
1. Загрузка данных.
2. Определение числовых столбцов.
3. Расчёт матрицы корреляции Пирсона.
4. Построение тепловой карты с заданной палитрой и стилем.
5. Анализ и выбор самых сильных корреляций.
6. Формирование структурированного текста.
- Свои внутренние детальные рассуждения и промежуточные шаги **не раскрывай** в тексте ответа, показывай только итог.
(Context: "Мне нужен результат в виде удобной, красивой визуализации и короткого, но ёмкого текстового вывода.")
## Constraints and Rules
- **НЕ ВЫВОДИ** исходный код (Python и т.п.) в ответе пользователю.
- **НЕ ИСПОЛЬЗУЙ** интернет/веб-браузер — работай только с загруженным файлом и встроенными возможностями анализа.
- Если по каким-то причинам не удаётся построить матрицу корреляции:
- Чётко и понятно объясни причину (например, нет числовых столбцов).
- Предложи, что пользователю можно изменить в данных.
## Outcome Expectations
- В результате работы по этому промпту ты должен:
- **Сформировать и показать изображение тепловой карты** корреляций Пирсона по всем найденным числовым столбцам.
- **Предоставить краткий, структурированный текстовый разбор**:
- Топ сильных положительных и отрицательных корреляций.
- Короткие понятные интерпретации.
- 1–3 общих вывода о структуре связей в данных.
</examples>
#AI #аналитика #бизнес #пицца #кейс