Найти тему

Как я удалённую информацию спасал. Личный опыт - учитесь на чужих ошибках

Одна из песен группы Пикник начиналась словами "Мы нашли себе дело на целую ночь". Так вот, я нашёл, вернее сам создал себе ситуацию, после которой я нашёл себе дело на много и много свободного времени, которое я бы мог посвятить чему-нибудь более полезному и плодотворному. Я имею в виду ситуацию, описанную в заметке "ZetOS и сопутствующие проблемы". Не читали? Ладно,повторю.

По личной неосторожности, я установил разрабатываемую мной сборку Линукс на свой внешний диск с архивом. Переформатировав его из FAT-32 в ext4. Диск KESU на 320 Гб. Что на нём было? Большая подборка музыки, какое-то количество художественных и документальных фильмов, множество личных фотографий, различные материалы по Линукс (образы дистрибутивов, программы, книги), большая библиотека художественных (и не только) книг и журналов, материалы для работы и сайта, много-много материалов по моллюскам. Я уже давно в Интернете работаю - моему сайту уже больше 20 лет. И на ранних этапах, когда со скоростями в интернете было не слишком хорошо, я очень многое скачивал на компьютер - отдельные статьи, фотографии, а иногда и целые сайты по ракушкам. Иногда - довольно большие - ведь всегда можно потом спокойно заниматься не волнуясь на счёт интернета. Это было время, когда довольно свободно можно было найти множество полезной информации относительно свободно - главное, знать где искать. Качал и из простых файлообменников, и с торрентов и с Мула (eMule - кто помнит). Сейчас уже этих ресурсов нет. Но я успел сохранить у себя довольно много книг и статей по ракушкам и моллюскам в формате pdf за то время.

И вот теперь всё это оказалось под угрозой. Когда я это обнаружил - утром следующего дня, первая мысль была - что мне удастся восстановить? При наличии Интернета, найти любую музыку и фильмы не составит большого труда, с программным обеспечением проблем тоже не будет. А вот всё остальное... Правда 16 Гб личных фотографий у меня уже были продублированы на отдельной флешке, и это уже хорошо. Я это сделал ещё четыре года назад. Многие книги были скачаны очень давно, и тоже где-то сохранились на DVD диске - посмотрю позже. Остаются личные фотографии, не вошедшие на эту флешку и те, что были сделаны в более позднее время. Но самое важное - это литература по моллюскам, фотографии ракушек, которые я делал для своего каталога и энциклопедии на сайте, материалы своего сайта, материалы с фотографиями заметок, которые я писал для канала на Дзен и много-много текстовых файлов. Может и ещё что нибудь.

Я работаю на ноутбуке с операционной системой Линукс - той самой моей ZetOS. Поэтому и информацию я буду спасать её средствами. Посмотрев в интернете, подключил внешний диск и запустил я сперва утилиту photorec, входящую в пакет testdisk. В отдельный каталог recup, эта программа, по мере работы, выкладывает восстановленные файлы в подкаталоги вида "recup_dir.№", содержащий 500 файлов. И таких подкаталогов у меня вышло 474! В них были как файлы mp3, jpg, png, так и всевозможные сценарии, скрипты и прочие файлы из свежеустановленной операционной системы. Сейчас я пока приостановил работу по сортировке этого каталога, отдав предпочтение спасению и сортировке фотографий и книг. Но я уже начал, и сейчас у меня только 197 подкаталогов - остальные содержали только то, что мне не важно, и смог это оценить без особого труда.

photorec
photorec

А особый труд при таких работах заключается ещё и в том, что все файлы имеют имя типа "f0277768" - то есть, каждый файл нужно открыть и посмотреть, что в нём, переименовать если нужно и удалить если не нужно. А предварительная сортировка заключалась в том, что в файловом менеджере я выбирал сортировку "по размеру" и удалял все файлы во всех каталогах меньше 1 кб. Затем - "по типу", и удалял все те, что мне не нужны. Пока приостановил, поскольку есть большие приоритеты. Но пока я сортировал эти файлы, я увидел, что файлов изображений очень мало. И эту ситуацию пришлось исправлять.

Для начала, я запустил утилиту foremost, указав восстановить файлы в формате pdf - те самые, в формате которых большинство моей литературы по моллюскам. Сразу скажу - очень удачно. Кое-что, особенно большие каталоги-определители, я уже рассортировал. С небольшими файлами статей буду разбираться позднее. И увидев ситуацию с изображениями после photorec, я снова запустил foremost, но уже для файлов jpg. Результат меня довольно сильно удивил - удалось восстановить 283600 файлов! И все в одном каталоге recover! У меня не сильно новый ноутбук, поэтому открытие каталога с таким количеством файлов - то ещё испытание. Сортировка заключалась в том, что я снова отсортировал файлы "по размеру" и удалил маленькие - до 10 кб файлы - довольно много. А затем открывал каталог в gThumb и дальше занимался уже в нём.

foremost
foremost

Файлов всё равно было очень много, приходилось очень часто перемещать файлы по категориям в отдельные каталоги, удалять повреждённые и просто не нужные, с учётом того, что они у меня уже есть. А самое интересное, что в восстановленных файлах оказались практически все мои книги и журналы формата pdf, но разбитые на отдельные страницы. Пришлось и с ними повозится. Сохранённые файлы прошли ещё процесс поиска дубликатов, после удаления которых их количество ещё немного уменьшилось. На сегодняшний день файлы изображений уже рассортированы, остановка за их идентификацией - долгий-долгий процесс.

Повреждённые файлы - кандидаты на удаления
Повреждённые файлы - кандидаты на удаления
Поиск дубликатов
Поиск дубликатов

И да, работа утилит выполняется с правами администратора, так что для более удобной работы в дальнейшем применяем chmod -R 777 и меняем права на папки recup_dir и recover.

Так и хочется перефразировав классиков литературы сказать: Товарищи люди! Будьте внимательны! Что-бы не было мучительно больно за потерянное, а также время, которое вы потратите на то, что-бы попытаться спасти хоть что-нибудь!