2.1.2 亮度动态范围
亮度动态范围是指系统能够表示亮度信号的最大值与最小值的比值。人眼所能感知的亮度动态范围通常为1012,而传统显示设备只能显示103的亮度动态范围,这个动态范围称为标准动态范围(Standard Dynamic Range, SDR)[13]。
1.伽马校正
由于视网膜上的光敏感细胞及视神经元都有自动适应光强的能力,因此人眼具有很强的细节分辨能力。图2.3给出了对比度门限随背景亮度变化的曲线,对比度门限是指人眼能观察到的最小亮度变化的对比度[14]。可以看到,在不同的背景亮度下,人眼的敏感度是不同的,人眼对较暗处的亮度变化十分敏感,而当亮度增加到一定程度时,对比度门限几乎维持常数。研究表明,在亮度呈现线性变化的情况下,人类视觉感受到的亮度并不是线性变化的,而是呈现幂函数关系[15]。
图2.3 对比度门限随背景亮度的变化
为了保证视频处理过程中视觉感知的一致性,通常将亮度信息进行非线性映射,使其被视觉线性感知。典型的视频获取、处理、显示过程如图2.4所示。摄影设备获取外界光信息,然后利用非线性映射转化为视觉感知线性的数字视频信号,该非线性映射称为光电转换函数(Opto-Electronic Transfer Function, OETF)。显示设备利用非线性映射将视频信号(视觉感知线性)转换成场景光线性信号,然后将其作为屏幕输出的光信息,该非线性映射称为电光转换函数(Electro-Optical Transfer Function, EOTF)。
图2.4 视频获取、处理、显示过程
ITU-R BT.709标准规定了SDR的光电转换函数:
其中,V为电信号;L为亮度。相应地,电光转换函数为光电转换函数的逆函数。
式(2-1)反映了光信号到电信号的非线性映射,也常称为伽马(Gamma)校正。伽马校正的目的是对人眼视觉特性进行补偿,根据人眼对亮度的感知能力,有效地表示亮度使其被视觉线性感知。另外,早期最常用的显示设备是CRT(Cathode Ray Tube)显示器。这类设备屏幕的显示亮度与施加的电压(电信号强度)关系大致是一个伽马值为2.5的幂函数曲线。显示器的这类伽马曲线也称为显示伽马(Display Gamma)曲线,为了与之匹配,图像获取设备就需要进行伽马校正。
2.高动态范围
现实世界中的场景,特别是户外场景往往具有很大的动态范围,如一些自然条件下的光照强度:阳光(105cd/m2),室内光线(102cd/m2),星光(10-3cd/m2)。相对于传统的SDR,高动态范围HDR(High-Dynamic Range)具有更宽的色彩范围、更高的亮度上限和更低的亮度下限,更好地反映了高动态范围的自然场景,可以给体验者带来更高质量的视觉感受。
针对HDR的扩大,ITU-R BT.2100标准[16]规范了两种光电转换曲线:PQ(Perceptual Quantization)和HLG(Hybrid Log-Gamma)。PQ是由杜比公司提出的一套光电转换算法,有更符合人类视觉感知的伽马曲线,适合在互联网上制作电影或流媒体内容。HLG由NHK和BBC联合推出,旨在使HDR内容与目前广泛运用的广播基础设施及SDR内容兼容,适用于广播电视和直播视频。
图2.5显示了HDR的PQ和HLG伽马曲线,可以看到,PQ伽马曲线的最高亮度固定为1000cd/m2,也就是说,无论显示设备的最高亮度如何,伽马曲线始终相同,上限为1000cd/m2,不会按照显示设备的亮度来进行适配。与PQ绝对映射相比,HLG是一种相对映射,它的优势在于可以向下兼容传统的伽马曲线,所以即使在现有的SDR显示器上,也可以观看HDR内容,并且图像劣化较小。PQ更注重画质,支持更大的动态范围(10000nits);HLG兼容性更好,能够使用现阶段的SDR设备,但最大动态范围只能支持5000nits。
图2.5 HDR的PQ和HLG伽马曲线
对于HDR视频,H.266/VVC中新增的亮度映射与色度缩放技术(Luma Mapping with Chroma Scaling, LMCS)支持块级QP调整的算法,以适应HDR视频更大的亮度动态范围和更宽的色彩空间,提升HDR视频(尤其是基于PQ的HDR视频)的压缩性能。