人工智能中文网
  • 主页
  • 线代考研视频
  • 线性代数
  • Python机器学习与算法
  • 大数据与机器学习
  • Python基础入门教程
  • 人工智能中文网
    教程目录
    阅读:

    无监督算法,机器学习无监督学习算法

    < 上一篇:监督学习算法 下一篇:推荐系统和深度学习 >
    无监督学习(Unsupervised Learning)是另一种机器学习算法,与监督学习不同的是,在无监督学习中,其样本中只含有特征,不包含标签信息。与监督学习(Supervised Learning)不同的是,由于无监督学习不包含标签信息,在学习时并不知道其分类结果是否正确。

    无监督学习的流程

    无监督学习流程的具体过程如图 1 所示。


    图 1 无监督学习流程

    对于具体的无监督学习任务,首先是获取到带有特征值的样本,假设有m个训练数据{X(1) ,X(2) ,…,X(m)},对这m个样本进行处理,得到样本中有用的信息,这个过程称为特征处理或者特征提取,最后是通过无监督学习算法处理这些样本,如利用聚类算法对这些样本进行聚类。

    无监督学习算法

    聚类算法是无监督学习算法中最典型的一种学习算法。聚类算法利用样本的特征,将具有相似特征的样本划分到同一个类别中,而不关心这个类别具体是什么。如表2所示的聚类问题:
    表 2 聚类问题
      是否有翅膀 是否有鳍
    样本 1(鲤鱼) 0 1
    样本 2 (鲫鱼) 0 1
    样本 3 (麻雀) 1 0
    样本 4 (喜鹊) 1 0

    在表 2 所示的聚类问题中,通过分别比较特征 1(是否有翅膀)和特征 2(是否有鳍),对上述的样本进行聚类。从表 2 中的数据可以看出,样本 1 和样本 2 较为相似,样本 3 和样本 4 较为相似,因此,可以将样本 1 和样本 2 划分到同一个类别中,将样本 3 和样本 4 划分到另一个类别中,而不用去关心样本 1 和样本 2 所属的类别具体是什么。

    除了聚类算法,在无监督学习中,还有一类重要的算法是降维的算法,数据降维基本原理是将样本点从输入空间通过线性或非线性变换映射到一个低维空间,从而获得一个关于原数据集紧致的低维表示。本教程中主要介绍聚类算法。
    < 上一篇:监督学习算法 下一篇:推荐系统和深度学习 >