博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
有监督学习、无监督学习、半监督学习
阅读量:4883 次
发布时间:2019-06-11

本文共 1299 字,大约阅读时间需要 4 分钟。

1.有监督学习:教计算机如何做事情。

  对于机器学习来说,有监督学习就是训练数据既有特征又有标签,通过训练,让机器可以自己找到特征和标签之间的联系,在面对只有特征没有标签的数据时,可以判断出标签。

举例:高考前所做的练习题是有标准答案的。在学习的过程中,我们可以通过对照答案,来分析问题找出方法,下一次在面对没有答案的问题时,往往也可以正确地解决。

有监督学习分为两类:分类或回归。

2.无监督学习:计算机自己学习。

  只给计算机训练数据,不给结果(标签),因此计算机无法准确地知道哪些数据具有哪些标签,只能凭借强大的计算能力分析数据的特征,从而得到一定的成果,通常是得到一些集合,集合内的数据在某些特征上相同或相似。

举例:再举高中做练习题的例子,就是所做的练习题没有标准答案,换句话说,你也不知道自己做的是否正确,没有参照。

无监督学习:聚类。

3.半监督学习

  半监督学习是有监督学习和无监督学习的中间带。对于半监督学习,其训练数据的一部分是有标签的,另一部分没有标签,而没标签数据的数量常常远远大于有标签数据数量(这也是符合现实情况的)。 隐藏在半监督学习下的基本规律在于:数据的分布必然不是完全随机的,通过一些有标签数据的局部特征,以及更多没标签数据的整体分布,就可以得到可以接受甚至是非常好的分类结果。

举例:再举高中做练习题的例子,就是所做的练习题一部分有标准答案,一部分没有标准答案。

从不同的学习场景看,半监督学习可分为四大类:分类、回归、聚类、降维。

1 )半监督分类 

半监督分类(Semi-Supervised Classification):是在无类标签的样例的帮助下训练有类标签的样本,获得比只用有类标签的样本训练得到的分类器性能更优的分类器,弥补有类标签的样本不足的缺陷,其中类标签取有限离散值。

2) 半监督回归 

半监督回归(Semi-Supervised Regression):在无输出的输入的帮助下训练有输出的输入,获得比只用有输出的输入训练得到的回归器性能更好的回归器,其中输出取连续值。

3 )半监督聚类 

半监督聚类(Semi-Supervised Clustering):在有类标签的样本的信息帮助下获得比只用无类标签的样例得到的结果更好的簇,提高聚类方法的精度。

4 )半监督降维 

半监督降维(Semi-Supervised Dimensionality Reduction):在有类标签的样本的信息帮助下找到高维输入数据的低维结构,同时保持原始高维数据和成对约束(Pair-Wise Constraints)的结构不变,即在高维空间中满足正约束(Must-Link Constraints)的样例在低维空间中相距很近,在高维空间中满足负约束(Cannot-Link Constraints)的样例在低维空间中距离很远。

原文链接:https://blog.csdn.net/haishu_zheng/article/details/77927525

转载于:https://www.cnblogs.com/go-go/p/9356151.html

你可能感兴趣的文章
Linux-重装系统之phpmyadmin安装
查看>>
POJ 1426 Find The Multiple(打表)
查看>>
PHP 在xampp中为项目访问配置本地域名的方法
查看>>
你常用但是你经常得搜的一些mysql命令
查看>>
第二组第八周学习心得
查看>>
SQL Server 中对XML数据的五种基本操作
查看>>
使用nginx实施负载均衡
查看>>
用户·角色·权限·表
查看>>
Winsock出错引起的断网
查看>>
函数的指针参数强制类型转换异常
查看>>
以ActiveMQ为例JAVA消息中间件学习【2】
查看>>
C#微信公众号——自定义菜单
查看>>
第十五周
查看>>
mysql千万级测试1亿数据的分页分析测试
查看>>
mfcc的特征提取python 代码实现和解析
查看>>
ppt画笔标记在哪里|ppt中画笔工具功能怎么用?
查看>>
可以有效改进项目管理技能的十个过程(转载)
查看>>
python26实例[文件copy和自动rename]
查看>>
Python: Write UTF-8 characters to csv file
查看>>
TypeError: isinstance() arg 2 must be a type or tuple of types
查看>>