Как мы смотрим на окружающий мир
Примерно так (слева - естественное изображение, справа - зрительный аппарат человека):
Задача любого тракта передачи изображений - сохранить такое положение вещей, т.е. передать изображение без искажений яркости. Для естественного (например, ТВ) изображения это должно выглядеть так:
Тракт "от света до света" состоит из трех звеньев: приемника изображения (в данном случае камеры), корректора (в данном случае памяти с табличной функцией перекодирования - lookup table - LUT) и дисплея (экрана). Корректор является опциональным звеном тракта. Камера преобразует свет в код, корректор - код в код и дисплей - код в свет.
Передающие функции каждого из трех звеньев тракта описываются выражением Y=kXγ. Для передачи без искажений тракт в целом должен быть линейным, т.е. γview=γcam*γlut*γdisp=1. Для лучшего восприятия изображения в условиях низкой освещенности часто принимают γview=1,125 (стандарт ITU-R BT.709). Как это влияет на восприятие, мы рассмотрим позже.
В случае искусственного (синтезированного) изображения тракт будет выглядеть так:
Казалось бы, как и в предыдущем случае, γview=γfile*γlut*γdisp=1. Но это не так. В этом случае γview≈3. Для того, чтобы понять, почему, рассмотрим звенья тракта.
Зрение: рекомендации CIE 1976
Человеческое зрение воспринимает яркость нелинейно. Природа сделала это для расширения динамического диапазона восприятия яркости. Поясним этот вопрос с помощью пары формул и рисунка.
Если предъявлять синтезированные линейные уровни яркости (кривая 1 на рисунке), то человеческое зрение будет воспринимать эти уровни нелинейно. В соответствии с рекомендациями CIE 1976 восприятие линейных уровней яркости для диапазона яркостей 100:1, описывается гамма-функцией (1) (кривая 2 на рисунке):
L = 9,033I I<0,8956 (1)
L = 116(I/100)^3-16 I>0,8856
где L – субъективная яркость, воспринимаемая человеческим зрением, I – объективная яркость.
Для того, чтобы получить субъективно линейные уровни яркости, необходимо ввести гамма-коррекцию. В идеальном случае такая гамма-коррекция описывается выражением (2), обратным гамма-функции (кривая 3 на рисунке).
I = I`/9,033 I`<7,99 (2)
I = 100((I`+16)/116)^3 I`>7,99
где I - откорректированная объективная яркость, I' - исходная объективная яркость.
Показатель степени в (2) принято называть гаммой, т.е. в данном случае γ=3. При предъявлении гамма-откорректированных уровней яркости (кривая 3), мы будем наблюдать субъективно линейные уровни яркости (кривая 4 на рисунке, совпадающая с кривой 1).
В этом и заключается суть гамма-коррекции – откорректировать входные уровни яркости таким образом, чтобы человеческое зрение воспринимало эти уровни линейно. То есть синтезированное изображение нужно подвергнуть гамма-коррекции с гаммой: γview≈3, точнее, в соответствии с выражением (2).
В каком из звеньев это нужно реализовать? Рассмотрим следующее звено тракта - дисплей (экран). В зависимости от типа дисплея, его световая характеристика может быть линейной (γ=1) или нелинейной (γ>1). Представителями дисплеев с нелинейной характеристикой являются электронно-лучевые трубки (ЭЛТ), а с линейной - светодиодные экраны, или, в более общем смысле, плоскопанельные дисплеи.
ЭЛТ дисплеи
ЭЛТ дисплеи по своей сути являются аналоговыми устройствами. Линейный на входе ЭЛТ сигнал преобразуется в яркость следующим образом:
L=100(I/100)^2,5 (3)
То есть γэлт=2,5. По удивительному совпадению световая характеристика ЭЛТ (3) достаточно близка к кривой гамма-коррекции (2), что можно видеть на рисунке (показаны только 50 младших уровней).
Следовательно, если мы показываем на ЭЛТ дисплее естественное изображение, то γview=γcam*γlut*γэлт=2,5. Тогда, для сохранения линейности тракта (γview=1) необходимо, чтобы γcam*γlut=1/2,5=0,4. Если нужно, чтобы γview=1,125, то γcam*γlut=1,125/2,5=0,45.
Если же мы показываем на ЭЛТ дисплее искусственное (синтезированное) изображение, для которого γview≈3, то никаких специальных мер принимать не нужно. Требуемое значение гаммы с достаточной точностью реализуется световой характеристикой ЭЛТ с γэлт=2,5 (см. рисунок выше). Поэтому при коррекции тракта формулу (2) часто заменяют формулой (3), что сделаем и мы. Тогда γview=2,5 или 1,125*2,5=2,8. Соответственно, γcam*γlut=1 или 1,125.
Что будет, когда мы перейдем к светодиодным экранам?
Светодиодные экраны
Светодиодные экраны являются цифровыми устройствами. В отличие от ЭЛТ, световая характеристика экрана во-первых принципиально линейна, а во-вторых, дискретна. То есть γled=1.
Следовательно, при показе на светодиодном экране естественного изображения мы имеем γview=γcam*γlut*γled=1 и коррекции тракта не требуется. Для γview=1,125 необходимо выполнить условие: γcam*γlut=1,125.
Когда мы переходим к работе с синтезированным изображением, для γview=2,5 нужно установить γfile*γlut=2,5, а для γview=2,8 - γfile*γlut=2,8.
Рассмотрим следующее звено тракта - источник изображения. Для естественных изображений это камера (сканер и т.д.), для искусственных это в общем случае файл.
Источники изображения
Камера может иметь как нелинейную (видикон), так и линейную (плюмбикон, ПЗС) световую характеристику. Независимо от этого, для большинства камер делают γcam=1/2,2=0,45. Это сложилось исторически и причиной тому - 100-летнее господство ЭЛТ. Позже характеристика камеры была уточнена следующим образом: (NTSC стандарт SMPTE-170M):
I` = 4,5I`` I``<4,608 (4)
I` = 281(I``/256)^0,45-25,344 I``>4,608
где I`` - входной параметр (исходная яркость), I` - выходной параметр (электрический сигнал).
Любопытно, что для видеостандартов PAL и SECAM рекомендована гамма γcam=1/2,8=0,36. Для простоты мы будем оперировать значением γcam=0,45, т.е. I`=I`^0,45.
Значение гаммы для синтезированных изображений определяется типом файла. В большинстве случаев γfile=1. Для некоторых типов изображений (.tga, .png и др.) гамма отличается от единицы.
На первый взгляд, исторически сложившаяся гамма-коррекция в камере исчезнет вместе с уходом со сцены ЭЛТ дисплеев. Но γcam играет еще одну важную роль: она более-менее выравнивает значения гаммы для естественных и искусственных искажений. Это достаточно важно в связи с тем, что границы между классами изображений достаточно условны и расплывчаты.
Связь гаммы с внешней освещенностью
Для того, чтобы увидеть младшую градацию яркости в условиях внешней освещенности, яркость этой градации должна превышать яркость фона в два раза. Это отношение называется пороговым контрастом. В соответствии с законом Вебера-Фехнера, в ограниченном диапазоне яркостей (от 1 ... 10 нит до 200 ... 500 нит, причем значение верхней границы точно не определено) величина порогового контраста постоянна и близка к единице.
(L-L0)/L0=const≈1 (5)
где L - яркость дисплея, L0 - яркость фона.
Теперь становится понятным, почему для низкой внешней освещенности (яркости фона) используется γview>1. Чем меньше внешняя освещенность, тем меньше должна быть первая градация яркости. Значение γview=1,5 используется в проекционных системах при наблюдении в темноте (освещенность 0 ... 5 люкс). Для наблюдения дисплеев в затемненных помещениях (10 ... 30 люкс) используется γview=1,25. Стандарт ITU-R BT.709 со значением γview=1,125 предполагает внешнюю освещенность 64 люкса. Типичная освещенность офиса и дома составляет 100 ... 200 люкс.
Чем больше величина гаммы, тем меньше значение первой градации яркости. Если первая градация при γview=1 равна единице, то при γview=1,5 первая градация будет равна 0,0625, при γview=1,25 - 0,25, а при γview=1,125 - 0,5 единицы.
Отсюда можно сделать вывод, что для дисплеев, работающих в условиях переменной внешней освещенности (например, уличных светодиодных экранов), величина гаммы должна быть переменной. Так как регулировка гаммы для экранов производится через LUT, то при показе естественных изображений на уличном светодиодном экране ночью следует использовать γlut=3,3, в сумерки γlut=2,8, в пасмурный день - γlut=2,5 и в солнечный день - γlut=2,2.
Конечно, все эти цифры достаточно условны. Для более точной гамма-коррекции необходимо знать точную световую характеристику камеры (или другого источника изображения) и историю последующей обработки сигнала. Если речь идет о синтезированных изображениях, нужно знать, какими инструментами они создавались и подвергались ли нелинейным преобразованиям. Как правило, такая информация неизвестна.
Поэтому остается использовать экспертную оценку качества гаммы-коррекции. Такая оценка должна производиться группой экспертов на тестовых изображениях в различных условиях внешней освещенности и с варьированием величины гаммы. Как правило, критерием качества являются отсутствие "провалов" на темных и светлых участках изображения и отсутствие ложных контуров. Самым точным инструментом оценки качества гамма-коррекции для синтезированных изображений является серая шкала. Как обсуждалось выше, гамма для естественных изображений должна быть несколько меньше (в 1,05 ... 1,15 раз) гаммы для синтезированных изображений.