心理视觉增强

心理视觉增强(英语:psychovisual enhancements)或称自适应增强adaptive quantization)、明亮掩码lumi masking[1][2],是一种由心理物理学启发的数字图像数字视频处理技术,用于改善图像与视频的主观质量。

理论

根据心理物理学韦伯定理,同一类刺激的最小可觉差与刺激的大小成比例。在图像与视频应用中,这一定理就体现为人对细节区域(比如,边缘)的相邻像素差异较为敏感,而对平滑区域差异则相对不敏感。因此可以对细节区域增加对比度,而对平滑区域减少对比度,从而在总的比特数量级不变的情况下,提高整体的主观质量。

在图像与视频压缩中的应用

图像压缩视频压缩算法中,量化过程是比特数得以减小的原因,不过也是产生失真的源头。同理,也可以对细节区域“细量化”,而对平滑区域“粗量化”,从而在保证一定压缩效率的同时提高主观质量。

图像与视频压缩质量的评估

压缩过程产生失真是不可避免的。通过比较原始的和压缩的图像和视频的画质,可以确定出压缩过程所产生的失真程度。评估准则有主观质量和客观质量。客观质量通常通过计算峰值信噪比得出,峰值信噪比越高则客观质量越好。主观质量则是通过人的视觉感受进行衡量,具有一定的不确定性。

参考资料

  1. ^ 康牧,王宝树. 基于人眼视觉特性的彩色图像自适应增强算法. 光学学报. 2009年11月, 29: 3019–3023 [2015-04-02]. (原始内容存档于2020-10-16). 
  2. ^ 刘江,苏未曰. 基于人眼视觉特性的图像质量评价方法研究. 中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集. 2007年 [2015-04-02]. (原始内容存档于2021-02-22). 

外部链接

  • 最小均方误差
  • 峰值信噪比