В этот раз проведем анализ рейтинга пива. Данные честно взяты с Kaggle. Проблематика: Как глядя на данные оценки пива респондентами сказать, какое пиво лучше и насколько. Данных предостаточно, поэтому можно безжалостно удалить строки с пропусками данных. Сразу удалим ненужные столбцы (brewery_id, review_time, beer_beerid ) Вообще - то удалять данные без переназначения переменных плохой тон. И когда то судьба меня за это накажет. Но не сегодня... А пока посмотрим на данные графически. review_overal - общая оценка - большинство более 4 балов view_aroma - оценка аромата - большинство оценок в районе 4. Но очень много оценок в от 3 и ниже. Вообще это странно и это может указывать на низкое качество сортов пива продаваемых сетевыми магазинами. В таких магазинах объем продаж будет высок даже у пива с рейтингом ниже среднего. review_appearance - оценка внешнего вида банки - большинство оценок более 4 балов, но есть и на троечку. review_palate - рейтинг вкуса - такая же картина как и с ар
Коректировка рейтинга пива на основе байевского метода (Bayesian average)
27 февраля 202227 фев 2022
11
3 мин