По какой-то причине Google не раскрывает даже приблизительное количество видео, залитых на фирменную площадку. Чтобы раскрыть эту тайну, блогер и основатель портала Global Voices Итан Цукерман вместе с другими энтузиастами использовал очень необычную методику — и, по его словам, добился успеха с приличной точностью.
В создании методики подсчёта энтузиасту помог Джейсон Баумгартнер — автор утилиты PushShift для автоматизированного сбора данных с портала Reddit. Программист предложил определить число роликов по количеству доступных на них ссылок.
Типичная ссылка на YouTube-видео выглядит так: https://www.youtube.com/watch?v=ioxEuSpUMkQ. При этом идентификатор ролика зашифрован в символах после watch?v=. Идея заключалась в том, чтобы раз за разом создавать случайно сгенерированную ссылку и проверять, ведёт она на существующее видео или нет. Автоматизировать работу энтузиастам помогла утилита для доступа к API платформы под названием InnerTube.
По результатам эксперимента выяснилось, что идентификатор может принять 18,4 квинтиллиона значений. Исследователи последовательно предполагали возможное число роликов и проверяли его с помощью случайной выборки. Например, если бы на платформе баз размещён 1 миллиард роликов, то один настоящий появлялся бы на каждые 18,4 млрд попыток. С помощью этого метода энтузиастам удалось вычислить, что сейчас на YouTube находятся примерно 13,325 миллиарда видео.
По данным исследования, в среднем каждый ролик набирает 39 просмотров, а рекомендательные алгоритмы сервиса «обращают внимание» только на видео с 10 000 и более просмотрами. Вдобавок стало известно, что за текущий год на платформе появились 4 млрд новых видео. Эту и другую статистику энтузиасты публикуют на сайте tubestats.org. Ознакомиться с полным описанием методики подсчётов (на английском языке) можно по этой ссылке.