4 подписчика
Разоблачение ИИ
Flickr Faces High-Quality (FFHQ) — это набор данных, созданный NVIDIA для исследования темы генерации лиц в 2019 году. Набор включает в себя 70 000 изображений с лицами пользователей сети Flickr. (пример фото в начале), Все фотографии использованы без согласия, фото были кадрированы, каталогизированны и подготовлены для лучшей работы алгоритмов. Также сохранены данные владельцев фото.
Исходные фотографии и набор данных распространяются под лицензией запрещающее коммерческое использование, но это не помешало NVIDIA и ADOBE использовать этот набор для исследований (зарегистрировано 11 и 8 патентов на коммерческие технологии).
С момента публикации в 2019 году набор FFHQ стал одним из наиболее широко используемых, хорошо организованных наборов данных о лицах. На него ссылаются более 2600 исследовательских работ и 255 патентов. Примеры использования: определение реального пола по области рта, распознавание лиц в маске, генерация изображений с лицами, прогнозирование старения лица, модификация лиц и тд.
В настоящее время более 10% набора FFHQ были удалены по просьбе пользователей. Однако удалены только из исходного набора и остались во всех копиях и производных наборах.
Помимо официального использования остаётся еще и теневая сторона, когда использование набора не упоминается. Этот набор данных до сих пор в открытом доступе, является лучше всего подготовленным для использования (можно сразу использовать с помощью пары строк кода)
PS: Утечка данных и неправомерное их использование уже обычное дело, тут можно развести руками. А вот манипуляции с этими данными, растущие возможности на основе этих данных – заставляют задуматься.
В комментариях мой пост на эту тему в FB десятилетней выдержки
1 минута
8 июля 2024