🍌 Pico-Banana-400K: как Apple обучает ИИ понимать человеческие правки
Apple тихо, без пресс-релизов, выложила на GitHub один из самых интересных наборов данных 2025 года — Pico-Banana-400K.
Это почти 400 000 пар “изображение — текст — редактированная версия”, созданных специально для обучения моделей редактирования картинок по текстовым инструкциям.
Звучит просто, но на деле — это огромный шаг к “интерактивным Photoshop-ам будущего”, где не нужно трогать слои и маски: достаточно сказать «Сделай вечернее освещение и убери туристов», и ИИ всё поймёт. Набор данных устроен как многоуровневая лаборатория для машинного зрения...