表征学习

在机器学习中，特征学习（feature learning）或表征学习（representation learning）^[1]是学习一个特征的技术的集合：将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦，允许计算机学习使用特征的同时，也学习如何提取特征：学习如何学习。

机器学习任务，例如分类问题，通常都要求输入在数学上或者在计算上都非常便于处理，在这样的前提下，特征学习就应运而生了。然而，现实世界中的数据，例如图片、影片，以及感测器的测量值都非常的复杂、冗长又多变，如何有效的提取出特征并且将其表达出来成为了一个重要挑战。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时，还不便于推广。这就要求特征学习技术的整体设计非常有效，自动化，并且易于推广。

特征学习可以被分为两类：监督的和无监督的，类似于机器学习。

在监督特征学习中，被标记过的数据被当做特征用来学习。例如神经网络，多层感知器，(监督)字典学习。
在无监督特征学习中，未被标记过的数据被当做特征用来学习。例如(无监督)字典学习，独立成分分析，自动编码，矩阵分解^[2] ，各种聚类分析及其变形^[3]^[4]^[5]。

[1]

[2]

[3]

[4]

[5]

表征学习

监督特征学习

监督字典学习

神经网络

无监督特征学习

κ-平均算法

主要成分分析

独立成分分析

局部线性嵌入算法

无监督字典学习

另见

参考文献

Wikiwand - on