Себастиан Верник, ученый-биоинформатик и гуру работы с данными, рассказал, как стратегии на основе анализа статистических данных позволяют каналам узнавать, что мы хотим смотреть, и почему анализ не всегда работает идеально.
"Пока они смотрят сериалы, на самом деле за ними наблюдают"
Можете попытаться представить, как популярные каналы вроде Netflix, HBO или CBS выбирают сериалы, которые мы потом смотрим, пересматриваем и ждем (для затравки: Netflix принадлежит “Оранжевый — хит сезона”, HBO свело мир с ума “Игрой престолов”, а CBS выпустил “Как я встретил вашу маму”)? Было бы странно предположить, что команда, ответственная за новые идеи, собирается и говорит: “Вот интересная тема, давайте снимем, а потом уже как-нибудь продадим”.
Время, когда люди смотрели все за неимением выбора, давно осталось в прошлом: сейчас каждый сезон десятки и сотни телеканалов выпускают тысячи серий телешоу, для просмотра которых вряд ли хватит целой жизни. Тем не менее некоторые из этих сериалов становятся настолько успешными, что образуют вокруг себя культ, другие заносятся в список “посмотрю когда-нибудь”, а многие и вовсе остаются незамеченными и закрываются после первого сезона.
Себастиан Верник даже сделал простой график успеха, проанализировав рейтинги двух с половиной тысяч сериалов по данным IMDB (крупнейшая в мире база данных и веб-сайт о кинематографе). Шоу оценивают по шкале от 1 до 10, а высота кривой показывает количество сериалов с соответствующей оценкой. Догадываетесь, кто получил 9 и больше и стал чемпионом? Здесь все те сериалы, начав смотреть которые вы уже не можете остановиться, на которые вы готовы тратить часы и дни: “Во все тяжкие”, “Игра престолов”, “Прослушка” и другие. Победителем с обратной стороны становится шоу “Коронованные детки”, и то, что это название вам ни о чем не говорит, является показателем популярности.
Поэтому когда Рой Прайс, менеджер в “Амазон Студиос” (Amazon Studios), выбирает сериал, который снимет его компания в следующем году, ему важно знать, почему “Обмани меня” прерывают на самом интересном месте после трех сезонов, а “Сверхъестественное” продолжает собирать перед экраном аудиторию уже 12 лет.
Ответ вроде бы очевиден: рейтинги. Действительно, сейчас это слово определяет будущее любого продукта на телевидении. Кто делает рейтинги? Тут тоже все просто: зрители. Но как каналу узнать, какой сериал вы больше всего любите? А теперь приготовьтесь: за вами следят. Чтобы узнать, что вас заинтересует, Рой с командой снимут восемь пилотных серий и выложат в сеть, чтобы их посмотрело как можно больше людей.
Когда Amazon бесплатно раздает что-то, мы, конечно, берем, правда? Миллионы зрителей смотрят эти эпизоды. Но они не осознают, что пока они смотрят сериалы, на самом деле наблюдают за ними. За ними наблюдает Рой Прайс и его команда, они записывают все. Записывают, когда кто-то нажал “Воспроизвести”, “Пауза”, какие части они пропускают, какие — пересматривают.
Анализ данных о ваших предпочтениях, о трендах, о вашем возрасте и времени, которое вы тратите перед экраном, - это идеальная схема, которая должна дать каналу представление о том, чего вы хотите. Собрав такие данные о миллионах зрителей, они получают готовое решение: нужно снять комедийный сериал о четверке сенаторов-республиканцев. Так Amazon выпустил “Альфа-дом”. Но что делать, когда…
…анализ не работает
Что если сбор данных, проведенный по всем правилам, не приводит к ожидаемому результату? Если по всем прогнозам у вас должна быть минимум девятка, а на деле шоу еле дотягивает до семерки? Вдвойне обидно, если в то же время на другом канале выходит сериал, который попадает в топ, а от вашего почти не отличается: и тема похожая, и время выхода. Верник подчеркивает, что с одними и теми же данными можно работать по-разному.
Пока Amazon снимал пилоты новых сериалов, Netflix наблюдал за старыми. Он выяснил, какие ситкомы зрители оценили выше других, каких актеров или режиссеров они выбирают чаще, что пересматривают. Собрав и проанализировав все данные, Netflix решил выпустить свой сериал о сенаторе, сделав из комедии драму и оставив политика без компании. Речь, конечно, о суперуспешном “Карточном домике” с Кевином Спейси и Робин Райт в главных ролях. Режиссером первой серии стал Дэвид Финчер (“Семь”, “Бойцовский клуб”, “Социальная сеть”).
Две крупные компании, которые знают, как работать с данными и собирают кучу информации, получают противоположный результат. Почему? Вывод напрашивается сам собой: даже проанализировав миллионы страниц с данными, вы рискуете принять не лучший выбор, потому что статистики недостаточно.
Если анализ данных не работает, то это даже страшновато, потому что мы живем во время, когда все больше работаем с данными для принятия серьезных решений, которые выходят далеко за рамки ТВ.
Лектор приводит в пример случай, когда заключенный в Америке просит освободить его досрочно. Существует компания, которая проведет анализ данных об этом человеке и решит, стоит ли отпускать его раньше срока. То есть по сути компания сделает прогноз, достаточно ли хорош человек. И если компьютер, который сравнит всю информацию, сделает правильное решение, то все замечательно. Проблема в том, что даже самая совершенная машина может допустить ошибку.
Используйте мозг!
Кроме работы с данными, Себастьян Верник также занимается вычислительной геномикой. Здесь принимают решения о разработках лекарств, расшифровывают сходства и различия генов и ищут средство против рака. От правильности анализа данных зависит не то, насколько интересно мы проведем время у монитора, но то, насколько здоровую и долгую жизнь мы сможем прожить. И за время работы в этой сфере Верник сформулировал своеобразное правило, которым поделился со всеми слушателями и читателями лекции.
Когда вы решаете сложную проблему, вы обязательно делаете две вещи. Во-первых, вы берете проблему и раскладываете ее на кусочки, чтобы суметь глубоко проанализировать эти кусочки. А потом, конечно, вы делаете вторую часть. Вы собираете эти кусочки в одно целое, чтобы прийти к решению. Иногда приходится делать это не раз, но всегда есть два этапа: разложить на кусочки и собрать обратно.
Еще раз повторим алгоритм: проблема => полный анализ => решение. Как видим, анализ подходит для второго шага, а как найти решение? Инструментом для “собирания кусочков в целое” лектор называет… мозг. Даже не обладая всей информацией, человек может прийти к правильным выводам, особенно если этот человек - эксперт в какой-либо области. Вероятно, потому Netflix и добился успеха, что не полагался только на данные, но и доверился своей команде специалистов, которая, проведя анализ и изучив аудиторию, все-таки сама приняла решение о выпуске “Карточного домика”. Они взяли на себя ответственность, полагаясь не только на цифры, но и на свой опыт. Amazon же пошел обратным путем и вместо командной работы отдал приоритет в принятии решения вычислительной машине.
Конечно, основываясь на данных, мы принимаем более взвешенные и обдуманные решения. Но Верник, который большую часть жизни посвятил работе с Big Data, называет данные инструментом, а не королем информации. Анализ и статистика не примут решение, рискнуть ли вам, выбирая поездку в другую страну или просмотр нового фильма. Поэтому только ваше любопытство и умение брать на себя ответственность за результат помогут принимать правильные решения и становиться десяткой на графике.