Особенности общего назначения.
Yeh et al используют дескрипторы SIFT и предлагают относительные характеристики, сопоставляя фотографию запроса с фотографиями в группе галереи. Особенности съемки общего назначения, такие как Bagof-Visual-Word (BOV) и Fisher Vector (FV), рассмотрены в работах. В частности, SIFT и цветовые дескрипторы используются в качестве локальных дескрипторов, по которым обучается гауссовская смесительная модель (GMM).
Статистические данные до второго порядка этого GMM распределения затем кодируются с помощью BOV или FV. Также принимается пространственная пирамида и в качестве конечного представления снимка суммируя зашифрованные FV по регионам. Эти методы представляют собой попытку неявного моделирования фотографических правил путем их кодирования в общих чертах на основе контента, которые являются конкурентоспособными или даже превосходят простые черты, созданные вручную.
Специфические особенности.
Специфические особенности относятся к особенностям эстетической оценки изображения, оптимизированным для определенной категории фотографий, которые могут быть эффективны, когда сценарий использования фиксирован или известен заранее. Явная информация (например, характеристики человеческого лица, геометрические теги, информация о сцене, свойства внутренних компонентов персонажа) эксплуатируется в зависимости от характера задачи.
Li et al предлагают регрессионную модель, ориентированную только на потребительские фотографии с лицами. Связанные с лицом социальные функции (такие как выражение лица, поза лица, относительная позиция лица) и персептивные функции (симметрия распределения лица, композиция лица, согласованность поз) специально разработаны для измерения качества изображений лиц, и в работе показано, что они дополняют традиционные для этой задачи функции (контраст яркости, соотношения цветов, четкости контраста и простоты цвета фона). Регрессия вектора поддержки используется для получения эстетических баллов для изображений.
Lienhard et al исследуют особенности лица для оценки эстетического качества снимков головы. Для оформления черт лица/снимков головы входное изображение разделено на субрегионы (область глаз, область рта, глобальная область лица и вся область изображения).
Низкоуровневые параметры (резкость, освещенность, контрастность, темный канал, оттенок и насыщенность в цветовом пространстве HSV) вычисляются из каждого региона. Эти функции на уровне пикселей предполагают восприятие человеком при просмотре изображения лица, следовательно, можно разумно смоделировать снимки головы. В качестве классификатора используется SVM с гауссовым ядром.
Su et al предлагают пакет с эстетическими функциями для сохранения живописных/ландшафтных фотографий. В частности, снимок разлагается на n*n пространственных сеток, затем из каждого участка выделяются низкоуровневые объекты в HSV-цветовом пространстве, а также LBP, HOG и характерные особенности.
Последняя функция генерируется с помощью заранее определенной операции перехода для использования геометрии ландшафтной композиции. В качестве классификатора используется AdaBoost. Эти особенности направлены на моделирование только пейзажных изображений и могут быть ограничены в их репрезентативной силе при общей эстетической оценке изображения.
Yin et al построили сценарнозависимую эстетическую модель, объединив информацию о географическом положении с дескрипторами GIST и пространственным расположением наиболее важных элементов для эстетической классификации сцен (таких как мосты, горы и пляжи). В качестве классификатора используется SVM. Информация о географическом положении используется для привязки изображения целевой сцены к соответствующим снимкам, сделанным в одном и том же гео-контексте, затем эти соответствующие снимки используются в качестве обучающего раздела SVM.
Предлагаемая ими модель требует ввода изображений с географическими тегами, а также ограничивается живописными фотографиями. Для изображений сцен без гео-контекстной информации используется SVM, обученный работе с изображениями из той же категории сцены.
Sun et al разработали набор низкоуровневых элементов для эстетической оценки китайской каллиграфии. Они нацелены на рукописный китайский иероглиф на белом фоне, поэтому обычная цветовая информация не является полезной в этой задаче.
Глобальные фигуры, извлеченные на основе стандартных каллиграфических правил, вводятся для представления иероглифа. В частности, они учитывают выравнивание и стабильность, распределение белого пространства, зазоров хода, а также набор сверток, полностью связанных между собой выходных данных.
Особенности компоновки компонентов при моделировании эстетики рукописных символов. Нейронная сеть обратного распространения обучается в качестве регрессора для получения эстетического балла за каждый ввод.