冯 宁,宋 利,解 蓉
( 上海交通大学 图像通信与网络工程研究所,上海 200240)
摘要: 为了提升对 HDR 技术整体认知以及其发展情况的整体把握,本文介绍了 HDR 相关的特点及基本知识,然后具体介 绍了 HDR 相关的转换函数及兼容性等关键技术,并对现有的主流 HDR 编解码进行了详细介绍和对比,最后总结了 HDR 最新的标准化进展情况。
关键词: 高动态范围; 宽色域; 转换函数; HDR 编解码; HDR 兼容性
The analyses of key technologies and standardization of HDR
FENG Ning,SONG Li,XIE Rong
( Image communication and network engineering institute of Shanghai Jiaotong University,Shanghai 200240 ,China)
Abstract: In order to boost cognitive of HDR technology and the overall grasp of the development of HDR,this paper first intro- duces the characteristics and corresponding general knowledge. Key technologies of HDR,such as TF and compatibility are then presented,followed by the detailed description of schemes of HDR encoding and decoding. At the end,the latest information about HDR standardization is summarized.
Key words: HDR; WCG; EOTF / OETF; HDR encoding / decoding; compatibility of HDR
HDR / WCG 技术是超高清视频服务的关键技术 之一,是现阶段提升视频服务用户体验的主要驱动 力,带动了整个超高清视频服务从拍摄、制作、传输 到播放、显示等全链路的技术演进,成为当前标准化 组织和产业联盟的关注焦点。由于存在多种不同的 技术途径,并且各个阵营努力都在努力推广自己的 技术方案,导致不同标准组织中出现和多个技术规 范建议。这种多标准、多方案的局面尽管使得视频 服务和应用有了更多的灵活度,但也给 HDR / WCG 技术方案的选择和实施带来了不少困惑。本文通过 对 HDR 关键技术的深入分析,结合当前相关标准化 的最新进展,对代表性技术方案进行了分析比较。 论文首先介绍了 HDR 技术基础,接着对 HDR 显示 相关的技术进行了分析,包括 HDR / SDR 兼容性问 题、静态 / 动态 metadata、SDR / HDR 的转换等。进一 步,通过对代表性的 HDR 编码技术提案的详尽介 绍,比较不同方案的技术特征和局限性。最后,论文 总结了 HDR 标准化的最新进展。
1 HDR 技术基础
1. 1 高动态范围
HDR( High Dynamic Range ) ,即高动态范围图 像,指的是图像区域中最亮像素与最暗像素的比值。 影响显示质量的因素主要有 5 个因素: 时间分辨率、 空间分辨率、灰度分辨率、色彩空间范围和亮度动态 范围。而当前主流的 HDR 综合了其中的多个因素, 其中最主要的就是动态范围有了很大的提升,并且 将色彩空间由原来的 BT. 709 提升到 BT. 2020。对 一幅图像来说,动态范围指的是画面中最大亮度与 最小亮度的比值。高的动态范围可以提升图像对亮 部和暗部细节的表现。相比传统的 SDR 图像,HDR 图像可以提供更高的动态范围,还能提供更广的色 域和更高的亮度,可以更加真实地还原场景。
1. 2 宽色域
传统的 BT. 709 引入了 Gamma0. 5 的幂指数预 校正,可以根据显示器的亮度范围均衡化噪声,从而使得整体显示效果更佳。但由于 BT. 709 对高亮区 域进行了压缩,并且将显示器的最高亮度限制在 100nit,因此 BT. 709 已经限制了现有显示器的显示 能力。BT. 2020 标准是 ITU - R 在 2013 年发布的面 向超高清视频制作和显示系统的新一代标准,支持 分辨率为 3840 × 2160 /7680 × 4320 的超高清画面。 一方面,相比上一代标准 BT. 709,BT. 2020 将色深 由原来的 8bits 提高到了 10 bits /12 bits,从而使灰阶 过渡更加平滑,可以提升图像的细节表现; 另一方 面,BT. 2020 色域范围比 BT. 709 增加了 70% ,如图 1 所示,这意味着图像具有更加丰富的颜色表现。 除此之外,BT. 2020 在 gamma 校正方面也进行了一 定的修正。
1. 3 Gamma 校正
Gamma 最早来自于 CRT 显示器。由于物理设 备中,电信号的输入和亮度输出并不是呈现线性关 系,而这种非线性关系又会随着显示器的不同存在 差异,这种非线性程度即称为 gamma。因此,为了使 同样的图像在不同的显示器上显示相同的效果,必 须对其进行校正使其呈现线性关系,如图 2 所示。 Gamma 校正就是通过一个相反的非线性转换,来补 偿不同显示器之间的显示效果差异性。通常 gamma 校正的过程是在图像的拍摄过程中进行的,如图 3 所示为拍摄及显示与 gamma 的关系。 传统的 CRT 显示器固有 gamma 值为 2. 4,通常通过 gamma 为0. 5 的预校正使得其校正后的系统 gamma 值为 1. 2,适 于室内较暗的环境下观看。