Как нас обманывают... данные. Часть 2. Внимание на количество
Данные не говорят сами за себя - центральную роль здесь играет наш опыт и наше суждение. Д. Шпигельхалтер Продолжаем анализировать данные по шоколадным батончикам. Описание данных можно посмотреть в первой части. В этот раз попробуем оценить влияние расположения фабрики на рейтинг. Так как страна - это не числовая переменная, то сразу отпадают ряд приемов для проверки гипотез. Например всеми излюбленный df.corr() от pandas (проверка на корреляционные связи) Но можно же построить график средних оценок по странам...