В предыдущем посте мы познакомили вас с распределением Парето. Сегодня покажем, как оно выглядит в жизни, измерив количество дружеских связей между подписчиками vk-сообщества Матчасти. Для выгрузки данных мы воспользовались кодом на Python (блокнот) и официальным API VK. В сообществе оказалось 700 с чем-то подписчиков, многие из которых находятся друг у друга в друзьях. Соединив их в граф, мы обнаружили в нём "гигантскую компоненту" из 424 человек, которые могут дойти друг до друга по цепочке "рукопожатий" из подписчиков сообщества. С этой компонентой дальше и работали. Вот она: Построив граф, мы захотели выяснить, а как распределено количество соседей каждой вершины. Оказалось, что классическая формулировка закона Парето (20% семей обладают 80% дохода) в нашем случае чуть мягче: первые 20% подписчиков набрали только 60% дружеских связей. Затем мы нарисовали гистограмму: по оси X - округлённое число друзей в сообществе, по оси Y - количество подписчиком с таким числом друзей. Но она