Найти в Дзене
133 подписчика

Система поиска авторского контента YouTube


Иногда мне интересно узнать как решаются те или иные инженерные задачи крупных игроков типо YouTube. Например в вопросе авторского права.

Вот выпускает один автор достаточно популярный контент на аудиторию в десятки миллионов. Контент спорный и вызывает реакцию у других людей с аудиторией в сотни тысяч.

Эти "другие люди" начинают снимать реакцию на этот контент. И Ютуб, если автор попросил, начинает активно удалять ролики с нарушением авторских прав. В некоторых случах ютуб и просить не надо и зачищается все в угоду конкретного мнения.

Мне интересно как это делается технически — вот как сверяется звук/картинка с исходником? По кадрам? По слогам? По нескольким секундам? Как вычленяется, что именно эти 10 секунд являются частью другого ролика?

И вопросы к итоговому результату работы системы:
— почему можно сделать зеркальное отображение, наложить эффект и уже сходства нет?
— почему, если обманули автоматику, нельзя просто удалить это уже вручную?
— почему не сверяют по звуку? Ведь если есть вставки разговоров 1в1 как в оригинале, то можно же забанить? С музыкой же это отлично работает.
— кто решает какой контент можно копировать, а какой нет?

Оставлю за скобками факт отсутствия свободы слова в ютубе. Каждая страна свои интересы реализует на максимум и пример ютуба очень показателен. Кто YouTube придумал — тот и заказывает музыку.
1 минута