Краткая история появления сервиса Shazam.
1999, какой-то бар где-то в Лондоне.
– Мейт, что это за песня, мейт?
– Не знаю, мейт
Не секрет, что многие технологии появляются в ответ на простейшие бытовые проблемы. Они не становятся решением глобального потепления, не лечат людей от рака и не отправляют людей в космос. Большая их часть – банальные QoL (quality of life) улучшения. Например, технология, которая решает проблему пьяного студента из Лондона, который после 2-3 пинт пива непременно захотел уточнить название фоновой песни.
Примерно так в 1999 году (очевидно, это не выдержка из дневника Криса Бартона – основателя Shazam Entertainment Ltd.) и появился сервис Shazam, точнее так появилась идея сервиса, который запустился через 3 года. Разумеется, как и все остальные, эта история всего лишь основана на реальных событиях. Вряд ли Бартон писал алгоритмы на окне общежития, и я не утверждаю, что лампочка вспыхнула над головой пьяного Бартона в баре под какой-нибудь 'Born Slippy', но легенда забавная, в такой ситуации себя может представить каждый.
Как работает for dummies.
«Acoustic fingerprint» / «Музыкальный отпечаток»
Наверняка многим в детстве попадались раскраски с точками, концепт простой – при соединении точек получался контур, по которому можно было легко определить какой объект изображен.
Точки – пики частот относительно временного отрезка. В народе – "карта созвездий" (constellation map), она напоминает подобную раскраску. Точки (anchor points) составляют собой рисунок композиции – упрощенную форму визуализации уникального аудиосигнала.
База данных.
База «музыкальных отпечатков» с описанием известных композиций (напр. название, исполнитель).
Отпечатки привязываются к описанию, затем упаковываются и хешируются для дальнейшего хранения в базе данных. (Процесс гораздо более комплексный, здесь объяснение на пальцах).
Алгоритм сравнения.
На тот момент верхом мобильной мысли был телефон Nokia 8210. Разумеется, уровень записи через микрофон этого динозавра оставлял желать лучшего. Однако, даже на тот момент алгоритм анализа неплохо справлялся.
Все, что нужно было сделать – позвонить на номер 2580 и поднести телефон к колонке, запись проходила в течение 30 секунд. Затем алгоритм анализировал композицию и сравнивал её с существующей картотекой.
После успешного определения композиции на номер телефона, с которого был совершен звонок, приходило сообщение с названием песни и именем исполнителя.
Немного о цифрах:
£0.50 – Стоимость одной угаданной композиции
$8500000 – Общий размер инвестиций в Shazam Entertainment Ltd. в 2000г.
6 – Столько лет основной услугой Shazam оставались звонки на номер 2580
$400млн – Столько компания Apple заплатила за Shazam в 2017 году.