Найти тему
Кембрийский взрыв.

Специфические особенности фото.

Оглавление

Особенности общего назначения.

Yeh et al используют дескрипторы SIFT и предлагают относительные характеристики, сопоставляя фотографию запроса с фотографиями в группе галереи. Особенности съемки общего назначения, такие как Bagof-Visual-Word (BOV) и Fisher Vector (FV), рассмотрены в работах. В частности, SIFT и цветовые дескрипторы используются в качестве локальных дескрипторов, по которым обучается гауссовская смесительная модель (GMM).

Статистические данные до второго порядка этого GMM распределения затем кодируются с помощью BOV или FV. Также принимается пространственная пирамида и в качестве конечного представления снимка суммируя зашифрованные FV по регионам. Эти методы представляют собой попытку неявного моделирования фотографических правил путем их кодирования в общих чертах на основе контента, которые являются конкурентоспособными или даже превосходят простые черты, созданные вручную.

Специфические особенности.

Специфические особенности относятся к особенностям эстетической оценки изображения, оптимизированным для определенной категории фотографий, которые могут быть эффективны, когда сценарий использования фиксирован или известен заранее. Явная информация (например, характеристики человеческого лица, геометрические теги, информация о сцене, свойства внутренних компонентов персонажа) эксплуатируется в зависимости от характера задачи.

Li et al предлагают регрессионную модель, ориентированную только на потребительские фотографии с лицами. Связанные с лицом социальные функции (такие как выражение лица, поза лица, относительная позиция лица) и персептивные функции (симметрия распределения лица, композиция лица, согласованность поз) специально разработаны для измерения качества изображений лиц, и в работе показано, что они дополняют традиционные для этой задачи функции (контраст яркости, соотношения цветов, четкости контраста и простоты цвета фона). Регрессия вектора поддержки используется для получения эстетических баллов для изображений.

-2

Lienhard et al исследуют особенности лица для оценки эстетического качества снимков головы. Для оформления черт лица/снимков головы входное изображение разделено на субрегионы (область глаз, область рта, глобальная область лица и вся область изображения).

Низкоуровневые параметры (резкость, освещенность, контрастность, темный канал, оттенок и насыщенность в цветовом пространстве HSV) вычисляются из каждого региона. Эти функции на уровне пикселей предполагают восприятие человеком при просмотре изображения лица, следовательно, можно разумно смоделировать снимки головы. В качестве классификатора используется SVM с гауссовым ядром.

Su et al предлагают пакет с эстетическими функциями для сохранения живописных/ландшафтных фотографий. В частности, снимок разлагается на n*n пространственных сеток, затем из каждого участка выделяются низкоуровневые объекты в HSV-цветовом пространстве, а также LBP, HOG и характерные особенности.

Последняя функция генерируется с помощью заранее определенной операции перехода для использования геометрии ландшафтной композиции. В качестве классификатора используется AdaBoost. Эти особенности направлены на моделирование только пейзажных изображений и могут быть ограничены в их репрезентативной силе при общей эстетической оценке изображения.

Yin et al построили сценарнозависимую эстетическую модель, объединив информацию о географическом положении с дескрипторами GIST и пространственным расположением наиболее важных элементов для эстетической классификации сцен (таких как мосты, горы и пляжи). В качестве классификатора используется SVM. Информация о географическом положении используется для привязки изображения целевой сцены к соответствующим снимкам, сделанным в одном и том же гео-контексте, затем эти соответствующие снимки используются в качестве обучающего раздела SVM.

Предлагаемая ими модель требует ввода изображений с географическими тегами, а также ограничивается живописными фотографиями. Для изображений сцен без гео-контекстной информации используется SVM, обученный работе с изображениями из той же категории сцены.

-3

Sun et al разработали набор низкоуровневых элементов для эстетической оценки китайской каллиграфии. Они нацелены на рукописный китайский иероглиф на белом фоне, поэтому обычная цветовая информация не является полезной в этой задаче.

Глобальные фигуры, извлеченные на основе стандартных каллиграфических правил, вводятся для представления иероглифа. В частности, они учитывают выравнивание и стабильность, распределение белого пространства, зазоров хода, а также набор сверток, полностью связанных между собой выходных данных.

Особенности компоновки компонентов при моделировании эстетики рукописных символов. Нейронная сеть обратного распространения обучается в качестве регрессора для получения эстетического балла за каждый ввод.