найти не просто дубликаты файла, а похожие картинки. Которые могут иметь идентичные изображения, но быть чутка скадрированы или иметь различную цветокоррекцию.
Ка оказалось, в мире открытого софта есть программка findimagedupes, которая достаточно быстро делает то, что мне нужно.
findimagedupes -R -t 85 /media /Data/*
/media/Big Data/MEGA-PHOTOS/PhotoArchive/2011/temp/4/12.jpg
/media/Big Data/MEGA-PHOTOS/PhotoArchive/2011/temp/3/3288.jpg
Около минуты
4 октября 2022