差分编码

差分编码(英语:Delta encoding),又称增量编码,是指在序列式资料之间以数据差异英语Data differencing形式存储或发送资料的方式(相对于存储发送完整文件的方式)。差分编码应用广泛,如需要查看文件的历史更改记录(版本控制git等)、Windows中的远程差分压缩英语Remote Differential Compression在线备份等场景均用到了差分编码。

差异存储在称为“delta”或“diff”的不连续文件中。由于改变通常很小(平均占全部大小的2%),差分编码能大幅减少资料的重复。一连串独特的delta文件在空间上要比未编码的相等文件有效率多了。

差分编码的简单例子是存储序列式资料之间的差异(而不是存储资料本身):不存“2, 4, 6, 9, 7”,而是存“2, 2, 2, 3, -2”。单独使用用处不大,但是在序列式数值常出现时可以帮助压缩资料。

相关条目

  • 算法
  • 资料压缩
  • 数据结构
  • 增量调变
  • 编码