Как разбирать фото: метод с ИИ-ассистентом для 2000 снимков за один вечер...

24 июня24 июн

120

4 мин

У меня на телефоне лежало 2137 фотографий. Без подписей, без папок, без хронологии. Просто бесконечная лента, где день рождения бабушки соседствует с фото чека из «Пятёрочки». Знакомая картина? Я год откладывал разбор этого завала. А потом за один вечер привёл всё в порядок с помощью ИИ. Расскажу, как именно это вышло. Причина хаоса банальная: снимать легко, а сортировать скучно. Каждый день телефон добавляет 5–15 новых кадров. За год набирается около четырёх тысяч фото, и большинство из них вы не откроете никогда. Я заметил кое-что любопытное: люди боятся даже начинать. Психологи называют это «параличом перед объёмом». Кажется, что архив настолько огромный, что разобрать его физически невозможно. И чем дольше откладываешь, тем страшнее. Но вот в чём суть. Нейросети в 2026 году делают за минуты то, на что у человека ушли бы недели ручной работы. Распознавание лиц. Нейросеть находит все снимки конкретного человека, даже если он снят в разном возрасте, с непривычного ракурса, при плохом

Оглавление

Что конкретно умеет ИИ с вашими фотографиями?
Расскажу свой конкретный процесс.
Для тех, кто не готов отдавать личные снимки в облако, есть серьёзная альтернатива.

У меня на телефоне лежало 2137 фотографий. Без подписей, без папок, без хронологии. Просто бесконечная лента, где день рождения бабушки соседствует с фото чека из «Пятёрочки».

Знакомая картина? Я год откладывал разбор этого завала. А потом за один вечер привёл всё в порядок с помощью ИИ. Расскажу, как именно это вышло.

Причина хаоса банальная: снимать легко, а сортировать скучно. Каждый день телефон добавляет 5–15 новых кадров. За год набирается около четырёх тысяч фото, и большинство из них вы не откроете никогда.

Я заметил кое-что любопытное: люди боятся даже начинать. Психологи называют это «параличом перед объёмом». Кажется, что архив настолько огромный, что разобрать его физически невозможно. И чем дольше откладываешь, тем страшнее.

Но вот в чём суть. Нейросети в 2026 году делают за минуты то, на что у человека ушли бы недели ручной работы.

Что конкретно умеет ИИ с вашими фотографиями?

Распознавание лиц. Нейросеть находит все снимки конкретного человека, даже если он снят в разном возрасте, с непривычного ракурса, при плохом освещении. Google Photos умеет это с 2015 года, но к 2026 точность выросла до 98–99% по внутренним тестам Google.

Определение локаций и объектов. Без GPS-меток ИИ распознаёт, где и что происходит на снимке. Пляж, горы, детская площадка, ресторан. Модели вроде CLIP анализируют содержимое кадра и присваивают теги автоматически.

А вот самое интересное: генерация описаний. Нейросеть создаёт текстовые подписи к каждому фото. «Семейный ужин на даче, лето, за столом четыре человека». Для поиска по архиву это бесценно.

Расскажу свой конкретный процесс.

Инструментов на рынке хватает, я выбрал связку из двух.

Первым делом загрузил всё в Google Photos. На Android фото часто уже синхронизируются. Для iPhone нужно поставить приложение и включить автозагрузку. На 2000 снимков ушло около 40 минут при обычном домашнем Wi-Fi.

Потом пришлось подождать. Google Photos группирует снимки по лицам не мгновенно. Через пару часов в разделе «Люди» появились кластеры. Мне оставалось только подписать: это мама, это сын, это друг Серёжа.

И тут случилось то, ради чего всё затевалось. Я набрал в поиске «море 2024» и мгновенно получил все пляжные фото из отпуска. Написал «торт» – вылезли дни рождения за пять лет. Попробовал «кот» – нашлись все 47 снимков нашего Барсика, включая те, о которых я давно забыл.

Как это работает? Нейросеть анализирует каждое изображение: определяет объекты, лица, текст, локации. Всё сохраняется как семантический индекс. Поэтому поиск работает по смыслу, а не по имени файла.

Для тех, кто не готов отдавать личные снимки в облако, есть серьёзная альтернатива.

Immich. Self-hosted решение с открытым кодом. Разворачивается на домашнем сервере или даже на Raspberry Pi. Распознавание лиц и объектов работает полностью локaльно, без отправки данных куда-либо.

Я попробовал Immich на старом ноутбуке с Ubuntu. Установка через Docker заняла 15 минут. Интерфейс напоминает Google Photos, а распознавание лиц на небольших архивах работает почти так же точно. Обработка 2000 фото заняла около двух часов.

Есть и другие варианты: DigiKam для десктопа, PhotoPrism как ещё один self-hosted проект. Но Immich ближе всего к привычному мобильному опыту, по моему ощущению.

Группировка по лицам и местам – только полдела.

Настоящая летопись требует контекста. Через 20 лет вы откроете архив, и что увидите? Без подписей половина фото превратится в загадку: кто эти люди, где это было, зачем я вообще нажал на кнопку?

Для генерации описаний я использовал скрипт на Python с моделью LLaVA. Принцип простой: скрипт берёт фото, отправляет в мультимодальную модель, получает описание на естественном языке и записывает в метаданные файла как EXIF-комментарий.

Запускаешь на папку. Через 10–15 минут каждый файл содержит подпись. «Двое детей играют в снежки во дворе, зимний день, на заднем плане многоэтажный дом». Или: «Женщина задувает свечи на торте, вокруг пять человек, украшенная комната».

Можно использовать и облачные API: GPT-4o, Claude, Gemini. Отправляете фото, получаете описание. Но за каждый запрос нужно платить, и на 2000 снимков сумма выходит заметная.

Теперь про грабли.

Их четыре штуки, и о них обычно молчат.

Дубликаты. В типичном фотоархиве от 15 до 30 процентов содержимого – дубли, скриншоты, случайные кадры. Перед сортировкой прогоните архив через dupeGuru или встроенный детектор дублей в Immich. Иначе ИИ будет старательно сортировать мусор наравне с ценными фото.
Приватность. Загружая снимки в облако, вы передаёте сервису биометрию семьи: лица детей, домашние интерьеры, геолокации. Если для вас это критично, локальные решения – единственный разумный путь.
Ошибки распознавания. ИИ путает двоюродных братьев. Определяет ресторан как «кухня». Считает трёх человек четырьмя. Проверяйте результаты хотя бы бегло, особенно подписи к ключевым семейным снимкам.
Потеря метаданных. HEIC-файлы с iPhone иногда теряют дату съёмки при конвертации в JPEG. Перед массовой обработкой проверьте на паре файлов, что даты на месте. Потерять хронологию в процессе «наведения порядка» было бы обидно.

У меня вместо хаотичной ленты из тысяч снимков теперь настоящий семейный архив. Альбомы по людям, по годам, по местам. Каждое фото с описанием. Поиск по любому слову.

На всё ушёл один вечер. Не неделя и не «когда-нибудь потом».

Если вы годами откладывали разбор домашнего фотоархива, начните с малого. Загрузите последние 500 снимков в Google Photos или разверните Immich. Через час нейросеть разберёт за вас то, на что вы боялись даже смотреть. А потом вы, может быть, впервые за долгое время откроете фото пятилетней давности и вспомните тот самый вечер, который уже почти стёрся из памяти.

Сколько тем спрятано в одном детском воспоминании: ИИ ассистент нашёл 7 за минуту...

Андрей Широков | ИИ для дела: рабочие схемы | AINeuroLab26 мая

1 вечер с семейным альбомом + ИИ ассистент: набрал тем до конца года...

Андрей Широков | ИИ для дела: рабочие схемы | AINeuroLab31 мая

Ей 85, и она спасла семейный фотоархив: способ с помощью ИИ-ассистента...

Андрей Широков | ИИ для дела: рабочие схемы | AINeuroLab19 июня