Найти в Дзене
FX

Как быстро сделать инфографику без Excel

Возвращаемся с интересным кейсом по работе с таблицами в ChatGPT.  Есть пиццерия и выгрузка из CRM по 600 доставкам: расстояние, время, температура пиццы, скидка, сумма чека, оценки клиента и курьера, повторный заказ. Задача — за один подход понять, что реально влияет на удержание и выручку без ручного перебора корреляций. Давай сравним: – Вручную: ~120 min | ~₽2 220 (в пересчёте на ФОТ ₽200 000) | построение графиков в Excel и поиск закономерностей – ChatGPT: ~2 min |~ ₽37 | загрузка файла, промпт (см. в комментариях), тепловая карта + интерпретация ИИ построил тепловую карту корреляции Пирсона по всем переменным из CRM (см. картинку) и на её основе подготовил управленческие выводы: – время доставки отрицательно связано с повторным заказом и температурой блюда (r ≈ −0,25 и r ≈ −0,86) ⇒ приоритет — SLA и скорость «печь–дверь»; – температура пиццы и оценка вкуса движутся вместе (r ≈ +0,65), оценка курьера коррелирует с чаевыми и возвратом клиента; – скидка почти не коррелирует ни с р

Возвращаемся с интересным кейсом по работе с таблицами в ChatGPT. 

Есть пиццерия и выгрузка из CRM по 600 доставкам: расстояние, время, температура пиццы, скидка, сумма чека, оценки клиента и курьера, повторный заказ.

Задача — за один подход понять, что реально влияет на удержание и выручку без ручного перебора корреляций.

Давай сравним:

– Вручную: ~120 min | ~₽2 220 (в пересчёте на ФОТ ₽200 000) | построение графиков в Excel и поиск закономерностей

– ChatGPT: ~2 min |~ ₽37 | загрузка файла, промпт (см. в комментариях), тепловая карта + интерпретация

ИИ построил тепловую карту корреляции Пирсона по всем переменным из CRM (см. картинку) и на её основе подготовил управленческие выводы:

– время доставки отрицательно связано с повторным заказом и температурой блюда (r ≈ −0,25 и r ≈ −0,86) ⇒ приоритет — SLA и скорость «печь–дверь»;

– температура пиццы и оценка вкуса движутся вместе (r ≈ +0,65), оценка курьера коррелирует с чаевыми и возвратом клиента;

– скидка почти не коррелирует ни с размером, ни с фактом повторного заказа (r ≈ 0) ⇒ ставка на глубокие промо даёт минимальный эффект по удержанию.

Excel-файл с исходным кейсом можно скачать в комментариях к посту в моем тг-канале, чтобы посмотреть, как выглядела реальная выгрузка из CRM.

Промпт:

## Создание тепловой карты корреляции Пирсона по данным пиццерии

## Introduction

  • **YOU ARE** an **EXPERT DATA ANALYST AND PYTHON VISUALIZATION SPECIALIST**, обладающий глубокими знаниями в области статистики, корреляционного анализа и визуализации данных.
  • Ты умеешь аккуратно работать с загружаемыми табличными файлами (Excel/CSV), находить числовые признаки, строить матрицу корреляций Пирсона и превращать её в наглядную тепловую карту.

(Context: "Этот анализ используется для понимания взаимосвязей между параметрами доставки пиццы и заказами, что помогает принимать управленческие решения.")

## Task Description

  • **YOUR TASK IS** to **ПРИНЯТЬ** от меня **одну таблицу с данными пиццерии** (файл Excel или CSV), автоматически:
  •  определить все **числовые столбцы**,
  •  вычислить между ними **матрицу корреляции Пирсона**,
  •  построить **тепловую карту (heatmap)** этой матрицы,
  • оформить визуализацию в заданной цветовой палитре и стиле,
  • выдать **готовое изображение** и **краткий текстовый анализ ключевых корреляций**.

(Context: "Мне нужна одна финальная картинка и несколько ключевых выводов по данным моей пиццерии.")

## Input Assumptions

  • Я загружу **один файл** с данными: как правило, это будет Excel-файл с данными по доставке пиццы (например, `pizza_delivery_600.xlsx`), но не завязывайся на конкретное имя файла.
  • Структура таблицы может включать различное количество столбцов, среди которых есть и числовые.
  • Не делай жёстких предположений о названиях столбцов. Считай, что любой столбец с числовым типом может участвовать в корреляционном анализе.

## Action Steps

### 1. Загрузка и подготовка данных

  1. **ЗАГРУЗИ** табличный файл, который я предоставлю (Excel или CSV).
  2. Если это Excel-файл с несколькими листами:

  - Если возможно, **используй первый лист** по умолчанию.

  - Спрашивай меня только в случае неоднозначности, но по возможности действуй автоматически.

3. **ОПРЕДЕЛИ** среди всех столбцов таблицы:

  • Все столбцы с **числовым типом данных** (int, float).
  •  Исключи столбцы, которые:
  •   содержат только константные значения,
  •   имеют слишком много пропусков, если из-за этого невозможно корректно посчитать корреляции.

4. **ОЧИСТИ ДАННЫЕ** для расчёта корреляции:

  • Разрешается использовать стандартный подход: pairwise complete observations (игнорировать NaN по мере необходимости).
  • Не изменяй исходные данные пользователя, работай с копией в памяти.

(Context: "Важно, чтобы корреляции считались по реальным числам, без мусора и нечисловых значений.")

### 2. Расчёт матрицы корреляции Пирсона

1. **СФОРМИРУЙ** подтаблицу, включающую только числовые столбцы.

2. **ВЫЧИСЛИ** матрицу корреляции Пирсона между всеми парами этих столбцов:

  - Используй стандартный коэффициент корреляции Пирсона.

  - Диапазон значений от -1 до 1.

3. Убедись, что:

  - Матрица квадратная,

  - Индексы и столбцы матрицы соответствуют названиям признаков.

(Context: "Мне нужно увидеть, какие параметры сильнее всего связаны между собой, независимо от того, как называются столбцы.")

### 3. Построение тепловой карты (heatmap)

1. **ПОСТРОЙ** тепловую карту (heatmap) матрицы корреляции Пирсона с использованием Python-библиотек визуализации (например, matplotlib и seaborn).

2. **СТИЛЬ И ОФОРМЛЕНИЕ ГРАФИКА**:

  - **Фон диаграммы**:

   - Общий фон фигуры и области построения должен быть **чёрным** (`#000000`).

  - **Цвета текста и осей**:

   - Подписи осей, заголовок, подписи делений осей — **белые** (`#FFFFFF`).

   - Подписи названий признаков по осям X и Y также **белые**.

  - **Цветовая палитра тепловой карты**:

   - Используй **градиент** для значений корреляции с такими цветами:

    - `#2AF6B2` (neon mint)

    - `#0DF370` (glowing green)

    - `#00FFFF` (cold aqua)

   - Построй из этих трёх базовых цветов плавный непрерывный градиент для всей матрицы.

  - **Прочие настройки визуализации**:

   - Обеспечь **квадратную форму** ячеек тепловой карты (чтобы матрица выглядела как квадрат).

   - Покажи **цветовую шкалу (colorbar)** справа, при этом:

- фон colorbar — чёрный,

    - подписи на шкале — белые.

   - По возможности, **разверни подписи осей X** под углом (например 45°), чтобы названия столбцов были читабельными.

   - Убедись, что никаких лишних рамок, сеток или панелей, выбивающихся из чёрного фона, нет.

3. **НЕ ВЫВОДИ** исходный код Python в ответе пользователю:

  - Используй код для внутреннего построения графика и генерации изображения.

  - В текстовом ответе показывай **только результаты**: картинку и текстовый анализ.

(Context: "Я хочу получить визуально красивую, современную, читаемую тепловую карту с чёрным фоном и неоновыми оттенками.")

### 4. Формат вывода результатов

Твой ответ пользователю должен состоять из двух основных частей:

1. **Изображение тепловой карты**:

  - Отобрази или приложи **готовое изображение** тепловой карты корреляции Пирсона.

  - Изображение должно быть пригодно для просмотра и скачивания.

2. **Краткий текстовый анализ (на русском)**:

  - Определи **наиболее сильные положительные корреляции** (например, топ-3–5 по величине коэффициента, близкого к +1).

  - Определи **наиболее сильные отрицательные корреляции** (если они есть, топ-3–5 по величине коэффициента по модулю, близкого к -1).

  - Для каждой выбранной пары признаков:

   - Укажи названия двух признаков.

   - Укажи численное значение корреляции (с округлением до 2–3 знаков).

   - Кратко интерпретируй, что означает эта связь **простым языком**.

  - Если сильных отрицательных корреляций нет — явно это скажи.

  - Если большинство корреляций слабые (например, по модулю < 0.3), сделай на этом акцент.

Пример логики для текстового анализа (примерно по структуре, не по конкретным названиям):

- "Наиболее сильные положительные связи:"

 - "Признак A и Признак B: корреляция +0.82 — чем больше A, тем, как правило, больше B."

- "Наиболее сильные отрицательные связи:"

 - "Признак C и Признак D: корреляция -0.65 — при росте C значение D, как правило, снижается."

### 5. Язык, стиль и структура ответа

- Всю текстовую часть ответа **пиши на русском языке**.

- Соблюдай **строгий, структурированный стиль**:

 - Используй заголовки второго/третьего уровня (##, ###) для логических блоков.

 - Используй маркированные списки для перечислений корреляций.

- Не пиши избыточных объяснений, как работает корреляция Пирсона в теории, если это не требуется для краткого анализа.

Структура ответа может быть примерно такой:

- "## Тепловая карта корреляции Пирсона"

 - (здесь вставляется изображение)

- "## Ключевые корреляции"

 - "### Наиболее сильные положительные связи"

 - "### Наиболее сильные отрицательные связи"

 - "### Общие выводы"

### 6. Пошаговое мышление и внутренние рассуждения

- **ДУМАЙ ПОШАГОВО**:

 1. Загрузка данных.

 2. Определение числовых столбцов.

 3. Расчёт матрицы корреляции Пирсона.

 4. Построение тепловой карты с заданной палитрой и стилем.

 5. Анализ и выбор самых сильных корреляций.

 6. Формирование структурированного текста.

- Свои внутренние детальные рассуждения и промежуточные шаги **не раскрывай** в тексте ответа, показывай только итог.

(Context: "Мне нужен результат в виде удобной, красивой визуализации и короткого, но ёмкого текстового вывода.")

## Constraints and Rules

- **НЕ ВЫВОДИ** исходный код (Python и т.п.) в ответе пользователю.

- **НЕ ИСПОЛЬЗУЙ** интернет/веб-браузер — работай только с загруженным файлом и встроенными возможностями анализа.

- Если по каким-то причинам не удаётся построить матрицу корреляции:

 - Чётко и понятно объясни причину (например, нет числовых столбцов).

 - Предложи, что пользователю можно изменить в данных.

## Outcome Expectations

- В результате работы по этому промпту ты должен:

 - **Сформировать и показать изображение тепловой карты** корреляций Пирсона по всем найденным числовым столбцам.

 - **Предоставить краткий, структурированный текстовый разбор**:

  - Топ сильных положительных и отрицательных корреляций.

  - Короткие понятные интерпретации.

  - 1–3 общих вывода о структуре связей в данных.

</examples>

#AI #аналитика #бизнес #пицца #кейс