Найти тему
Евгений Маслак

Резервное копирование статей на Дзене в марте 2024 года (закат солнца вручную)

Статьи на Дзене, как и на любой другой коммерческой платформе для блогов могут исчезнуть в любой момент. Может быть сама организация захочет закрыть проект, может быть будут нарушены правила и статью уберут из публикации, может угонят аккаунт, может случиться технический сбой. Это не теоретические угрозы - все это уже происходило либо со мной, либо с кем-то из вас хотя бы однажды.

Те, кто считает меня "параноиком" - почитайте про кладбище Гугла, сходите на запрещенную в России соцсеть (и попробуйте полистать ее комфортно в роли анонима, без логина), поищите на Ютубе документальный фильм "Короли подземелья" 2015 года выпуска. Посмотрите на фотки и скриншоты из фильмов в ЖЖшной коммуне progulkino, например в этом посте. А еще я в свое время прикольные видосы на Рамблер Вижн загружал, помните такой сервис?

Что же делать? Делать нужно локальные копии ваших трудов, не доверяя сервисам в интернете. Вообще никаким. Они не плохие и не злодеи - они просто работают в бизнесе сферы услуг.

Особенно это важно для тех, кто публикует на блог-платформах плоды своих личных трудов и делает это "для души", а не занимается перепостами и воровством чужого контента ради сиюминутной выгоды. Именно энтузиасты, для которых блог - это хобби, уязвимее всего в подобных ситуациях. Сотни часов обработки фотографий, монтажа видео, набора текстов, творческие муки - и шанс потерять все результаты в течение микросекунд.

Важный момент - в этой статье я не буду касаться вопросов "правильного" хранения данных, создания и поддержки резервных копий ваших локальных данных - это отдельная обширная "наука" со своими правилами и холиворами. Если вы вообще впервые про это задумались - начните хотя бы с изучения принципа 3-2-1.

В этой статье речь пойдет исключительно о том, как сделать локальные копии ваших публикаций на Дзене!

К сожалению, в самом Дзене я не смог найти функционала, аналогичному Google Takeout или инструментов выгрузки ваших данных у запрещенной в РФ Меты. Дзен и Яндекс разделились, и в списке аналогичного яндексевского https://id.yandex.ru/personal/data тоже ничего похожего на публикации Дзена нет. Я честно искал, тыкался по менюшкам - и не нашел. У техподдержки не спрашивал, решил действовать сам.

Для начала я изучил статью коллеги по Дзену @classical_guitar "Поиск информации по собственному каналу Дзен" и убедился, что предложенные там решения за прошедшие 6 лет перестали работать - Дзен не отдает программе HTTrack ни байта информации из сохраняемой статьи, как ни бейся с настройками.

Нужно было придумать на скорую руку что-то надежное, простое, возможно не очень эффективное. И я придумал!

Откройте сохраняемую статью в любом актуальном браузере и убедитесь, что она отображается в том виде, в котором вами задумана. А далее просто жмите в браузере "Сохранить как" и сохраняйте всю статью как "Веб-страница полностью". Для удобства хранения можете воспользоваться плагинами к браузеру - я пользовался "SingleFile" для браузера Chrome. Плагин сложит всю страницу и все файлы к ней в один отдельный htm файл, который потом можно открыть и посмотреть в любом актуальном браузере.

Вроде все просто? Не тут то было! Если у вас для оформления статьи использовался инструмент "галерея", то сохранится только та фотка, которая была выбрана в момент сохранения, и сколько не жми на стрелочки (а они будут даже делать вид, что работают) - другие фотографии в галерее вы не увидите!

То же касается и "спойлеров" под которыми прячутся нераскрытые ветки комментариев и "ещё", прерывающие слишком длинные комментарии - вся информация за ними не сохранится.

Пришлось выдумать следующий способ, грубый, прямолинейный, экстенсивный, но на 100% рабочий (по крайней мере в марте 2024 года):

1)Откройте сохраняемую статью в любом актуальном браузере и убедитесь, что она отображается в том виде, в котором вами задумана. Промотайте всю статью до конца, при необходимости "перематывая" все галереи на первую картинку.

2)Под статьей раскройте все ветки комментариев, а на всех длинных комментариях - нажмите "ещё", чтобы раскрыть их полностью.

-2

3)Все раскрыв и перемотав - сохраняйте статью удобным способом (в моем примере - SingleFile).

-3

4)При сохранении могут подтягиваться анонсы других статей, что может увеличить время сохранения до минут (!!!). От чего это зависит и как с этим бороться - я так и не узнал, иногда приходилось просто ждать.

-4

5)Добавьте к названию сохраняемого файла нумерацию (в том случае, если у вас есть галереи).

-5

6)Мотайте статью обратно, перематывая каждую галерею на одну фотку вперед. После этого - сохраняйте еще одну копию, не забыв увеличить нумерацию в названии файла на единицу.

-6

7)Повторяйте перемотку и сохранения до тех пор, пока не перемотаете самую длинную галерею до последней картинки.

-7

Вот такой вот "закат солнца вручную". За те дни, пока я сохранял свои статьи - возненавидел галереи. Да и многим читателям они неудобны. Больше не буду злоупотреблять!

Итак, в итоге мы получаем от одной до нескольких копий сохраненной статьи, в которых есть текст, размещение и подписи всех картинок в статье и внутри галерей. Но сами картинки сохранятся не в полном разрешении (на март 2024 года в Дзене это 2400 пикселов по длинной стороне). Если они у вас в полном разрешении и в подготовленном для статьи виде сохранились - то хорошо, просто добавьте их к файлам сохраненных копий статьи. А если нет?

Тогда снова закатываем солнце вручную, но с некоторой помощью автоматизации.

8)Откройте статью и последовательно щелкайте на каждую картинку, правым щелчком мыши выбирая "Открыть картинку в новой вкладке". В новой вкладке должно открываться полное исходное изображение в исходном разрешении (в марте 2024 в конце адреса картинки должно быть "/scale_2400").

-8

9)Далее вы можете вручную из каждой вкладки сохранить картинку и вручную назвать файлы, но я боялся ошибиться и прибег к помощи автоматики. Для этого добавляем все открытые вкладки с полноразмерными картинками к статье в отдельную папку закладок браузера.

-9

10)Экспортируем все закладки из браузера в отдельный html файл.

-10

11)Находим в нем нужный нам список ссылок на полноразмерные картинки к статье.

-11

12)Сохраняем список в новом файле, при помощи автозамены "откусываем" ненужные тэги в начале и в конце ссылок.

-12

13)Должен получиться вот такой линейный список, без кавычек и тэгов.

-13

14)"Скармливаем" список на скачку программе wget или curl (да в принципе любой менеджер закачек, принимающий на вход списки подойдет, да и вышеупомянутый HTTrack должен справиться).

-14

15)Получаем автоматически пронумерованные в порядке скачивания файлы без расширения (так Дзен отдает изображения в марте 2024, таков путь...).

-15

16)Приводим нумерацию файлов к единому формату (добавляем нули перед цифрами там, где их не хватает).

-16

17)И финальным актом множественного переименования перенумеровываем файлы, чтобы нумерация начиналась не с 0, а с 1 и присваиваем правильное расширение - jpg.

-17

18)Теперь у нас есть один или несколько файлов с копией статьи и дополнительно - энное количество картинок в максимальном разрешении к этой статье. Из этой резервной копии можно восстановить статью где угодно, тут, на Дзене или на любой другой удобной платформе, или хранить вечно в своём локальном архиве. Опечатываем набор файлов контрольной суммой, чтобы следить за целостностью данных.

-18

19)Готово!

-19

Выше я привел свой порядок действий для сохранения формата публикации "Статья". "Посты" сохраняются похожим образом, принципиальной разницы со "Статьями" нет. А что делать с видео?

20)Сначала открываем страничку с видео, раскрываем все "спойлеры", "еще" и ветки комментариев. Сохраняем все это обычным способом, описанным выше. А как же само видео, сам видеофайл? Для его сохранения получаем ссылку на видео.

-20

21)Копируем ее.

-21

22)И скармливаем ее замечательной программе yt-dlp. В результате успешной ее работы получаем заветный видеофайл.

-22

Ну вроде все! На создании резервных копий всех 100 моих публикаций у меня ушло несколько дней. Весь архив на данный момент занимает больше 30 гигабайт, а рекордсмен по количеству сохраненных копий статьи имеет 21 htm файл (именно столько фоток было в самой длинной галерее статьи).

-23

При этом сами htm файлы с копиями статей занимают 1/3 объема резервной копии!

-24

Напоследок - общие мысли, рекомендации и выводы:

1)Делайте резервные копии статей сразу, не копите объем работ.

2)По возможности - сохраняйте сразу исходники в виде текстового файла и набора графических материалов и храните все это у себя в архиве.

3)Не злоупотребляйте "галереями"!

4)Развивайте культуру хранения данных настоящим образом.

5)Фантастический совет, но все же - изучите веб-программирование и напишите полную автоматизацию всей той ручной каторге, что я описал выше.

6)Лоббируйте законопроекты, аналогичные злым евросоюзовским - именно они заставили всех производителей смартфонов заряжаться от разъема USB, а большие и мощные "корпорации добра" - отдавать все загруженные пользователем данные по одному нажатию кнопки.

Верю, когда-нибудь и у Дзена появятся простые функции "сохранить локальную копию статьи" в редакторе или "скачать все данные пользователя" в профиле, и тогда эта моя статья потеряет всякий смысл. И я буду только рад!