特征提取

特征提取(英语:Feature extraction)在机器学习模式识别图像处理中有很多的应用。特征提取是从一个初始测量的资料集合中开始做,然后建构出富含资讯性而且不冗余的导出值,称为特征值(feature)。它可以帮助接续的学习过程和归纳的步骤,在某些情况下可以让人更容易对资料做出较好的诠释。特征提取是一个降低维度的步骤,初始的资料集合被降到更容易管理的族群(特征)以便于学习,同时保持描述原始资料集的精准性与完整性。[1]

当一个算法的输入资料太过于庞大冗余以至于不便处理(如:一样的测量方法但是分别使用英尺和米表示,或是影像中像素的重复性),这些资料可以被转换成化简后的特征集合,也称作特征向量(feature vector),决定这些原始资料子集的步骤称为特征提取[2] 。成功的情形下,被选择的特征包含跟输入资料相关的资讯,因此这些被化简后的特征能够被用来做理想的任务,而不使用原始完整的初始资料来做这个任务。

概论

相较于原始庞大的资料集合需要很大量的资源来描述,特征提取可以减少需要描述这些资料的资源。当我们分析复杂资料时,其中一个主要的问题是源自于变数的数量过多。分析很多个变数一般来说需要很大量的内存以及计算能力,同时太多变数也可能造成分类问题的算法有过度拟合于训练资料的现象,因此对新的采样无法有效地归纳。特征提取是处理变数组合并维持资料充足的准确性时,常通称的术语。很多机器学习的实作者认为适当的特征提取是有效模型构建的关键。[3]

可以利用已经建构好的应用相关的特征集合来改善结果,通常这样的特征集合是被专家所建构。其中一种此类处理被叫做特征工程师。除此之外,我们也可以使用一般的降维技术,如下:

图像处理

特征提取其中一个非常重要的应用领域为图像处理,其中的算法可以被用来侦测跟分离数位影像跟影片串流中,想要提取的部分或形状(特征)。常见的影像处理相关的特征处理如下:

低阶的特征

  • 边缘检测
  • 角检测
  • 斑点检测
  • 脊检测
  • 尺度不变特征转换

曲率

  • 边缘方向
  • 改变强度
  • 自相关

影像动作

  • 移动侦测
  • 微分方法
  • 光流法

形状相关

  • 二值化
  • 连通分量标记
  • 模板匹配
  • 霍夫变换
  • 广义霍夫变换

软件中的特征提取

很多资料分析的软件包提供特征提取以前资料降维。常见的数值编程环境有提供内建的指令来做一些较简单而常用的特称提取(例如:主成分分析)。更多特定的算法可以在公开的脚本或第三方提供的扩充包中取得。另外,也有软件包为了特定软件机器学习应用,特别为其设计特征提取。[4]

深度学习的特征提取

以往主成分分析为特征提取极常使用的降维方法,近来利用深度学习神经网络的自编码器则相当常被使用。他可以跟深度学习中的各种技术(例如:深度神经网络卷积神经网络)结合。其中,卷积神经网络能十分有效的撷取影像中的特征,因此对于影像的资料降维撷取特征的效果特别杰出。此外,卷积神经网络在大型数据库中影像辨识相关的议题上(例如:物件分类)取得相当杰出的成果。[5]。因此也有人使用在大型数据库上预先训练好的卷积神经网络来做特征提取。

参考资料

  1. ^ What is Feature Extraction?. deepai.org. (原始内容存档于2021-03-02). 
  2. ^ Alpaydin, Ethem. Introduction to Machine Learning. London: The MIT Press. 2010: 110 [4 February 2017]. ISBN 978-0-262-01243-0. (原始内容存档于2019-03-23). 
  3. ^ Reality AI Blog, "Its all about the features," September 2017, https://reality.ai/it-is-all-about-the-features/页面存档备份,存于互联网档案馆
  4. ^ for example, https://reality.ai/页面存档备份,存于互联网档案馆
  5. ^ ResNet https://arxiv.org/abs/1512.03385页面存档备份,存于互联网档案馆