可适性视频编码
可适性视频编码(Scalable Video Coding, SVC)是传统H.264/MPEG-4 AVC编码的延伸,可提升更大的编码弹性,并具有时间可适性(Temporal Scalability)、空间可适性(Spatial Scalability)及信噪比可适性(SNR Scalability)三大特性,使视频传输更能适应在异质的网络带宽[1][2][3]。
概述
SVC的目标在于标准化已使编码的高质量的影像码流,可以独立拆分成一个或多个子比特流(subset bitstream)进行解码,可以自己用一个复杂和重建质量达到类似的利用现有的H.264/MPEG-4 AVC的设计与相同数量的数据码流中的一个子集。
一个子比特流(subset bitstream)可以代表一个空间或时间分辨率较低或质量较差的的视频信号(每个单独或组合)相比。
- 时间(帧速率)的可适性:由于一般视频压缩都会利用运动补偿的手段,纪录位移向量(motion vector)。在某些系统的应用上,可以跳过某几帧用其邻近帧的位移向量内插出该被跳过帧的结果。在解码端同样利用运动补偿算回该被跳过帧。
- 空间(图片大小)的可适性:图形(或视频压缩中的一帧)在压缩编码的时候即存下了多重大小(或清晰度)的结果。让解码端得以视需求解码回所需的图片大小(或清晰度),可能以较小的结果换取解码的效率。通常较小的图片即带有大图片一部分的特性,大图的存储上不需要重复记录这些重复的部分。
- 信噪比/质量/质量可适性:在压缩编码的时候将多重质量(qualities)的结果都存下来。让解码端得以视需求解码回所需的图片质量,可能以较低的质量换取解码的效率。通常质量较差的图片仍有一定的代表性,质量较佳的结果在存储上不需要重复记录重复的信息。
- 联合可适性(Combined scalability):结合上述三个扩展性。
例子
空间可适性与质量可适性的综合应用可以参考JPEG 2000影像压缩。JPEG 2000从递进性(Progressive)与可适性(Scaling)两个角度来看待:
- 从递进性的角度来看,解码的过程会先去截取前端低清晰度信息,先解得低清晰度图片;再一步步截取更多信息,逐步增进清晰度。这代表了用户可以视需求只解码部分而得到缩略图,节省计算量。
- 从可适性的角度来看,其编码内容可以在任意位置截断,从头至此的编码片段可被解码回一张较低清晰度的图片。编码片段越长,解码后的清晰度越高(或说放大到同样清晰度时,其峰值信噪比(PSNR)较佳)。这意味了当需要更高压缩率时,直接丢弃后方的编码资料即可达成。
里程碑
- 2003年10月,Moving Picture Experts Group(MPEG)提出SVC Technology的提议
- 2004年4月: 第14版提议出炉
规范
- Scalable Baseline Profile
- 支持B frame,加权预测的CABAC熵编码法,以及8 × 8亮度变换在增强层,虽然基础层(base layer)要符合有限制baseline。
- 质量和时间(Quality and temporal)可扩展编码的支持不受任何限制。
- Scalable High Profile
- Scalable High Intra Profile
参见
外部链接
参考资料
- ^ Overview paper on SVC by H. Schwarz, D. Marpe, and T. Wiegand (PDF). [2014-04-10]. (原始内容存档 (PDF)于2020-11-27).
- ^ HHI presentation of the Scalable Extension of H.264/AVC. [2014-04-10]. (原始内容存档于2020-01-11).
- ^ MPEG - Technologies - Overview of Scalable Video Coding. [2014-04-10]. (原始内容存档于2016-08-02).