Найти тему
Аналитика данных

Как провести t-test каждой группы данных с каждой другой группой

Допустим нужно сравнить комбинации выборок по группам – каждую с каждой. Например есть датафрейм с товарами разного веса продающиеся на Wildberries или Ozon, и нужно сравнить среднюю цену 1 кг у каждого товара с каждым другим товаром. Изначально мы выгрузили данные среди которых есть колонка 'Товар' и колонка 'Цена_1кг'. Как теперь быстро всё это протестить не прописывая каждое сравнение вручную? А вот так, используя библиотеку python itertools:

Python-код
Python-код
Проведение ttest-a с помощью ttest_ind и itertools