Найти тему
IT-советы и секреты

Как удалить дубликаты фотографий или похожие снимки?

На днях передо мной встала задача: нужно было найти и удалить дубликаты фотографий, а также фотографии-дубли из большого архив фото, сделанных на iPad и несколько телефонов. Вручную просмотреть 35 тысяч файлов — это потратить кучу времени. Лучше найти программу, которая автоматизирует процесс поиска и удаления одинаковых, а также похожих фотографий. Мне по душе пришлось бесплатное приложение AntiDupl.NET (к тому же оно на русском языке и с подробной справкой). Первая версия, кстати, вышла еще в далеком 2003 году.

Шаг 1
Последняя на сегодня версия — AntiDupl.NET-2.3.8 (18 сентября 2015 года).
Скачиваем, устанавливаем и запускаем программу. По желанию включаем русский интерфейс: View > Language > Русский.

Шаг 2
По умолчанию все удаленные дубликаты будут удаляться с винчестера сразу, минуя корзину. Если вы хотите, чтобы файлы удалялись в корзину, нужно зайти в меню
Поиск > Опции > Дополнительные > Удалять в корзину (нужно активировать этот пункт, если он неактивен).

Шаг 3
В главном окне нажимаем на изображение папки с надписью open. Нам нужно добавить те папки (каталоги), где мы будем искать дубликаты и схожие изображения.

-3

Шаг 4
В главном окне выбираем алгоритм анализа изображений. По умолчанию стоит режим Mean square ("Среднеквадратичная разность"). Этот метод высчитывает среднеквадратичное отклонение яркости для каждой пары изображений. Он более быстрый, но чаще ошибается на картинках с большим однородным фоном. Так что второй параметр ("Пороговая разность") лучше не ставить больше 5%. При больших значениях вы получите большой процент ошибок.
Алгоритм SSIM работает медленнее, но лучше сравнивает изображения с большим однородным фоном. По умолчанию пороговая разность для SSIM стоит на уровне 30%. По-моему, это слишком много. 10% будет достаточно.

Шаг 5
Нажимаем на зеленую кнопку «Пуск». Программа начнет анализ всех изображений в заданных папках. Через некоторое время (все зависит от количества и размера фотографий) AntiDupl покажет вам результаты поиска. Кстати, если в следующий заход вы увеличите "пороговую разность", поиск дубликатов произойдет гораздо быстрее за счет созданной базы данных по анализированным картинкам.

Шаг 6
По умолчанию сравниваемые картинки будут показываться сбоку (режим вертикальных пар). Можно зайти в меню Вид > Режим просмотра результатов и выбрать опцию «Таблица горизонтальных пар».

-6
-7

Шаг 7
Можно просматривать каждую пару и применять к ней одно из действий:
— удалить первую(ые) картинки в выделенных результатах
— удалить вторую(ые) картинки в выделенных результатах
— удалить все парные картинки в выделенных результатах

Шаг 8
Я предпочитаю выделить все пары (клавиша Ctrl+A) и удалять все вторые картинки. Так гораздо быстрее.
Однако помните, что при этом вы можете удалить более лучшую фотографию, а более худшую оставить. Так что если изображения ценные, просматривайте каждую пару.

Увы, программа еще не умеет учитывать все нюансы (например, закрытые глаза у людей). Так что AntiDupl пока можно рекомендовать для чистки архивов с не очень ценными фотографиями и картинками.
В моем случае удалось уменьшить архив с 50 до 42 Гб, выиграв 8 Гб (16%).

Рекомендую для чистки использовать оба метода по очереди. Так вы найдете больше дубликатов и схожих изображений.

P.P.S. Обязательно загляните в подробное описание программы. Там много интересных возможностей, про которые я не успел рассказать.