Здравствуйте!
Ранее я рассказывала об особенностях фильмов на русском языке которые были обнаружены в базе данных кинолент иностранного портала!
Здесь же рассмотрим основные материалы, также немного расскажу об особенностях и найденных инсайтах. Будет интересно!
Приступим:
- рейтинг фильмов от 0 до 10, средний рейтинг - 6, крайне мало фильмов с рейтингом 10 баллов.
- отмечу что не сильно хотят оставлять свой голос в оценках. БОльшая часть - это до 3,5 тыс. проголосовавших, но конечно замечу и что бывают уникальные фильмы с кол-ом голосований более 30 тыс. голосов.
- бюджет - есть и ОЧЕНЬ дорогие фильмы с бюджетом около 600 млн. но конечно подавляющая часть и высокая плотность данных вокруг 50-70 млн. долл.
- превалируют фильмы с доходом менее четверти миллиарда долл., максимум доход немного не добрал до 3 млрд. долл.
- выходят произведения по времени 100-125 минут чаще, но видим что есть и 400 минутные, скорее всего это сериалы, мини-сериалы.
- и видим что чем ближе к современности тем больше по количеству выходит лент, и сразу отметим спад в самом конце - следствие медицинских ограничений в период заболеванием Сovid.
Первоначально в файле было 10000 записей с данным за 1902-2028 год, после удаления часть данных с пропущенными важными показателями остались данные с 1902 по 2026 гг.
1900- ые были началом эры кинематографии, постепенно объемы возрастали. С 1980 года можно отметить существенный подъем с пиком в районе до Пандемии, а на будущие выпуски сильно повлияли простои и неясности в кинопроизводстве. Напомню что после съемок идет обработка и подгонка материалов перед выходом на экран через приличный промежуток времени (порой более года). 2022 г был серьезно на пике - еще были в производстве снятые до 2019 гг. материалы. Далее сильный спуск.
Смотрим на Линейную взаимосвязь предоставленных данных:
- Количество голосовавших сильно коррелирует с общим доходом фильма. Логично - большее кол-просмотров фильма = бОльшее количество отзывов и увеличение прибыли от фильма.
- Бюджет на производство фильма интересен в качестве стимула просмотра. К количеству проголосовавших - есть корреляция.
- Бюджет коррелирует с доходом.
Интересные инсайты
Обнаружили что неоднократно некоторые фильмы переснимали.
313 названий лент было найдено в виде повторов (более 2 раз) - этот факт обнаружен был в целях поиска какого - либо рода неявных дубликатов - но как оказалось это повторные съемки (экранизации) одного произведения но в разные периоды.
Какие-то произведения снимали 2 раза, к примеру в лидерах оказалась "Золушка" - ее повторяли 5 раз, "Красавицу и чудовище" - 4 раза.
Первое из упомянутых повторов "Золушки" было выпущено в 50-г. и в прокате заняло средний рейтинг 7 - очень хорошие показатели с учетом того что не было интернет-платформ для широкого охвата - зрители высоко оценили произведение. Если цифры в бюджете и выручке правдивы, то при затратах в 2,9 млн. долл., 263,6 млн. долл. - размер прибыли. Ясно что популярность произведения вскружило голову и уже в 2015 году на успехе предшественницы - "Золушка" №2 повторила достижения и в рейтинге (6,8) и в ошеломляющей прибыли в 543,5 млн.долл. при затратах в 95 млн.
К сожалению данных по фин. показателям других 3-х "Золушек" в этих данных нет, (1965, 2011 и 2021 года), но видим притяжение зрителей. Заметим продолжительность лент тоже разная - минимум 74 минуты и 180 мин. (телефильм).
А знаете какое самое "возрастное" произведение переснятое много позже ?
«Малыш» (англ. The Kid) — американский немой семейный фильм 1921 года, первая полнометражная режиссёрская работа Чарльза Чаплина, занявшая второе место по кассовым сборам в 1921 году.
График - как часто экранизируют фильмы по жанрам
В описании фильмов среди жанров тех фильмов которые любят переснимать выделяются: Драма - 15 %, Комедии - 11 %, Экшены/Триллеры - 10%.
Примечательно что экранизации романтических/фантазийных/для семейного просмотра фильмы по характеристикам не так сильно встречаются в описании - всего по 5 процентов.
На каких языках представлены киноленты:
Как и ожидалось: на английском языке выходит подавляющее большинство English -7098, следующий по интенсивности - японский Japanese - 693 и примечательно что почти на одном уровне выходят фильмы на китайском и кантонском языках (147/134).
На русском языке фильмы представлены в кол-ве 67 шт.
...
для информации: кантонский язык также употребляется жителями Гонконга и Макао в повседневной жизни. В странах с традиционно высоким числом китайского населения (Канада, Перу, Панама, США, Австралия) местные китайцы сохраняют говоры родины своих предков: эмигранты из окрестностей Гуанчжоу говорят на кантонском.
...
в самом низу списка:
· Panjabi -1 кинолента
· Norwegian Bokmal 1
· Macedonian 1
· Irish - 1
· Estonian -1
· Dzongkha -1
· sh -1
Dzongkha - официальный язык Королевства Бутан, а sh - обозначен сербский язык.
20 продюсерских компаний которые чаще всего участвовали в создании фильмов
Warner Bros на первом месте, Dream Works Animation на 2 месте, Dune - 3 место, 20th century Fox т.д.
Доходность
2.9 миллиарда долларов - максимум. Напомню что у нас данные и за начало прошлого века - доходы были гораздо ниже. Сейчас и вложение в производство совершенно другое - линейную корреляцию между тратами в создание и доходами мы видели ранее.
Выделим фильмы начиная с 90 года по текущий момент (массовое производство c высокими бюджетами) и посмотрим какие доходы имеют фильмы:
Средние показатели в прибыли производства фильма с 90-хх. гг. = 120 млн. долл. на каждый фильм, медианные показатели - 47 млн. долл. -пример того как отдельные сильные показатели по другим фильмам влияют на средние значения общей массы.
Аватар 2009 года собрал самую большую прибыль!
удивились?
бОльшая часть фильмов сильно не доходит до полумиллиарда прибыли - все что выше - нетипичные показатели сборов для общей массы фильмов.
boxplot (график ниже) показывает нетипичные показатели. При подсчете их оказалось 572 (очень неплохо, согласитесь)!
Длительность фильмов по годам (в среднем)
Как можете понять, в настоящее время киноленты выпускаются в районе 100 минут. Пики в 30-хх и 40-хх могу обосновать небольшим количеством кинолент.
Данные о фильмах - это бесценный ресурс для понимания индустрии развлечений и принятия обоснованных решений. Анализ данных помогает нам обнаруживать тенденции, прогнозировать результаты, понимать предпочтения аудитории и создавать наиболее успешные фильмы.
Если у вас есть конкретные вопросы об анализе данных по фильмам или если нужна помощь с использованием данных, не стесняйтесь обращаться!
Также пишите что Вас еще интересует и подсказывайте идеи для дальнейших расследований.
Успехов!!!