在人工智能和机器学习方面,就是监督和无监督学习之间的区别? 你能否提供一个例子的基本的,简单的解释?
Answer 1:
既然你问这个很基本的问题,它看起来像它的价值是什么指定机器学习本身。
机器学习是一类的算法是数据驱动的,即不像“正常”算法这是数据“讲述”什么是“不好回答”是。 示例:对于图像的人脸检测一个假设的非机器学习算法会试图定义一个面对的是什么(圆皮样色盘,暗区,您所期望的眼睛等)。 机器学习算法就不会有这样的编码定义,但将“学习按例子”:你会告诉面孔和不面孔和一个好的算法的几个图像最终将学习,能够预测是否一个看不见的图像是面部。
人脸检测的这个特殊的例子进行监督 ,这意味着你的例子必须贴有标签 ,或者明确地说哪些是面的,哪些不是。
在无监督算法的例子并不标记 ,即你不说什么。 当然,在这种情况下,算法本身不能“发明”面对的是什么,但可以尝试集群中的数据分成不同的组,例如,它可以区分面孔是从风景,这是从马很大的不同有很大不同。
由于另一个答案提到它(尽管在一个不正确的方式):有“中间”形式的监督,即半监督和主动学习 。 从技术上讲,这些方法的监督,其中有一些“聪明”的方式,以避免大量的标识样本。 在主动学习,算法本身决定你应该标注哪些东西(例如,它可以很肯定的一道风景和一匹马,但它可能会要求您确认是否大猩猩的确是脸的图片)。 在半监督学习,有与标记的例子入手,然后“告诉”他们互相思考一些大量无标签数据的方法两种不同的算法。 从这个“讨论”,他们学习。
Answer 2:
监督学习是当你的数据与饲料被“标记”或“标记”你的算法,来帮助你的逻辑做出决策。
例如:贝叶斯垃圾邮件过滤,在那里你必须标志的项目为垃圾邮件细化的结果。
无监督学习是种算法试图找到相关性不低于原始数据之外的任何外部输入。
例如:数据挖掘聚类算法。
Answer 3:
监督学习
应用,其中所述训练数据包括与它们相应的目标矢量沿着输入载体的实例是称为监督学习的问题。
无监督学习
在其它模式识别问题,训练数据包括没有任何相应的目标值的一组输入向量x的的。 在这样的监督学习问题的目标可能是数据,在那里它被称为集群内发现类似的例子组
模式识别和机器学习(主教,2006年)
Answer 4:
在监督学习,输入x
被提供与预期的结果y
(即,输出该模型应该产生当输入是x
对应的输入),这通常被称为“类”(或“标签”) x
。
在无监督学习,该示例的“类” x
不设置。 所以,无监督学习可以被认为是在未标记的数据集中寻找“隐藏结构”。
途径监督学习包括:
分类(1R,朴素贝叶斯,决策树学习算法,如ID3 CART,等等)
数值预报
方法无监督学习包括:
聚类(K均值,层次聚类)
关联规则学习
Answer 5:
我可以告诉你一个例子。
假设你需要识别哪些车辆是一辆汽车,其中一个是摩托车。
在监督学习的情况下,你的输入(培训)数据集需要被标记,也就是说,在您输入(培训)数据集中的每个输入元素,你应该如果它代表了一个汽车或摩托车指定。
在无监督学习的情况下,你不标注的输入。 无监督聚类模型的输入到例如基于类似的特征/属性的簇。 所以,在这种情况下,有像“车”没有标签。
Answer 6:
举例来说,很多时候训练神经网络监督学习:你告诉哪个类对应你喂养的特征向量网络。
聚类分析是无监督学习:你让算法决定如何组样品放入共享公共属性的类。
无监督学习的另一个例子是基于Kohonen的自组织映射 。
Answer 7:
我一直觉得无监督之间的区别和监督学习是任意的,有点混乱。 有两种情况之间没有真正的区别,而是存在一种算法可以有更多或更少的“监督”的一系列情况。 半监督学习的存在是其中线是模糊的一个明显的例子。
我倾向于认为监管为提供反馈到什么解决办法应该是首选的算法。 对于传统的监督环境,如垃圾邮件检测,你告诉算法“不要让训练集任何错误”; 对于传统的无监督的设置,如集群,你告诉算法“点是接近对方应该是相同的集群中”。 碰巧的是,反馈的第一种形式是很多比后者更具体。
总之,当有人说“监督”,认为分类,当他们说“无人监管”想集群和尽量不要太担心它不止于此。
Answer 8:
机器学习:它探讨的是可以借鉴,并就data.Such算法预测工作由以使表述为输出数据驱动的预测或决定,而不是遵循严格的静态建立从例如输入模型算法的研究和建设程序指令。
监督学习:它是从标记的训练data.The训练数据推断功能的机器学习任务由一组训练例子。 在监督学习,各实施例中是一对由一个输入的对象(通常是载体)和期望的输出值(也称为监督信号)。 受监督的学习算法分析所述训练数据和产生的推断功能,其可以被用于映射新的例子。
计算机呈现例如输入和它们的期望输出,由“老师”给出,并且目标是学习映射输入outputs.Specifically一般规则,受监督的学习算法将一组已知的输入数据和已知响应的到的数据(输出),并且将训练模型来产生用于响应于新的数据合理预测。
无监督学习:这是学习无师自通。 你可能想用数据做一个基本的东西是对其进行可视化。 这是推断功能无标签的数据描述隐藏结构的机器学习任务。 由于提供给学习者的实例是未标记的,没有错误或报酬信号以评估潜在的解决方案。 这区别于监督学习无监督学习。 无监督学习使用试图找到的模式自然分区程序。
随着监督学习是没有根据预测结果的反馈,即,没有老师来纠正you.Under没有提供标识样本的非监督学习方法并没有在学习过程中没有输出的概念。 其结果是,它是由学习方案/模型中寻找模式或发现输入数据的组
您应该使用无监督的学习方法时,你需要大量的数据来训练你的模型,意愿和能力进行试验和探索,当然这是没有得到很好的通过更确立methods.With监督学习解决的一个挑战它可以学习更大和更复杂的模型比监督学习。 这是它一个很好的例子
。
Answer 9:
监督学习
监督学习是基于与正确的分类已经分配从数据源训练数据样本。 这样的技术被用于前馈或多层感知器(MLP)的模型。 这些MLP有三个鲜明的特点:
- 隐含神经元不属于该网络的输入或输出的层,使网络学习和解决任何复杂的问题的一部分的一个或多个层
- 反映在神经元活动的非线性是可微的,并且
- 网络的互连模型表现出高度的连通性。
通过培训学习沿着这些特性解决困难和问题多种多样。 通过有监督的人工神经网络模型的培训学习也被称为误差传播算法。 误差校正学习算法训练基于所述输入 - 输出样本的网络并发现误差信号,它是所计算的输出与所需输出之差,并且调整神经元的突触权重成比例的误差的乘积信号和突触权重的输入实例。 基于这个原理,误差反向传播学习发生在两个关:
直传:
在这里,输入矢量被呈现给网络。 这个输入信号通过网络由神经元向前传播,神经元,并在所述网络作为输出信号的输出端出现了: y(n) = φ(v(n))
其中v(n)
是诱导神经元的局部场通过定义v(n) =Σ w(n)y(n).
即在输出层O(N)计算出的输出与期望的响应进行比较d(n)
,并发现该错误e(n)
为神经元。 网络的这一关过程中的突触权重遗体相同。
倒推:
即起源于该层的输出神经元的误差信号通过网络向后传播。 此计算在每一层每个神经元的局部梯度和允许网络经历了根据delta规则的改变的突触权重:
Δw(n) = η * δ(n) * y(n).
这个递归运算继续,继续进行直传接着向后通每个输入模式,直到网络收敛。
人工神经网络的监督学习范例是有效的,并发现解决方案以几个线性和非线性问题,如分类,工厂控制,预测,预测,机器人等。
无监督学习
自组织神经网络学会使用无监督学习算法来识别未标记的输入数据中隐藏的模式。 这种无监督指的是学习,不提供错误信号,以评估可能的解决方法组织信息的能力。 缺乏对监督学习的学习算法方向的有时可以是有利的,因为它可以让算法回首对于以前没有考虑的模式。 自组织映射的主要特点(SOM)是:
- 它把任意的尺寸的输入信号图案成一个或2维映射并自适应地执行此变换
- 网络表示用由排列成行和列的神经元的单个计算前馈层结构。 在表示的每个阶段中,每个输入信号被保持在适当的背景,并且
- 处理的信息密切相关的片段神经元彼此靠近,他们通过突触连接进行通信。
计算层也被称为竞争层因为在层中的神经元彼此竞争变得活跃。 因此,这种学习算法称为竞争算法。 在SOM无监督算法的工作分三个阶段:
比赛阶段:
对于每个输入图案x
,呈现给网络,与突触权重的内积w
被计算并在竞争激烈的层中的神经元发现诱导的神经元之间的竞争,这是接近在输入向量的突触权重向量的判别函数欧氏距离被宣布成为在竞争中的赢家。 这种神经元称为最佳匹配神经元,
i.e. x = arg min ║x - w║.
合作阶段:
获胜神经元确定拓扑邻里中心h
配合神经元。 这是通过横向相互作用进行d
协同神经元之间。 这种拓扑邻里在一段时间内缩小其尺寸。
自适应阶段:
使获胜神经元和其邻域神经元通过突触合适重量调整,增加判别函数的它们各自的值在相对于输入图案,
Δw = ηh(x)(x –w).
在训练模式的重复演示,突触权重矢量倾向于跟随输入图案的分布由于附近更新并且因此ANN学习没有主管。
自组织模式自然代表了神经生物学行为,因此在许多现实世界的应用,如集群,语音识别,纹理分割,矢量编码等使用
参考。
Answer 10:
监督学习 :你给不同标记示例数据作为输入,用正确的答案一起。 此算法会从中吸取教训,并开始预测基于后面输入正确的结果。 例如 :垃圾电子邮件过滤器
无监督学习 :你刚才给的数据,不告诉任何东西-如标签或正确的答案。 算法自动分析数据中的模式。 例如 :谷歌新闻
Answer 11:
我会尽量保持简单。
监督学习:在学习这种技术,我们给出一个数据集和体系已经知道该数据集的正确的输出。 所以在这里,我们的系统学习,通过预测其自身的价值。 然后,通过使用成本函数来检查它的预测有多接近实际产量确实的精度检查。
无监督学习:在这种方法中,我们有什么我们的结果是很少或根本没有的知识。 因此,相反,我们得到的地方,我们不知道变量的影响的数据结构。 我们通过聚类基于数据变量之间关系的数据作出结构。 在这里,我们并没有基于我们预测的反馈。
Answer 12:
监督学习,给出一个答案的数据。
标记为垃圾邮件/非垃圾邮件指定的电子邮件,了解垃圾邮件过滤器。
鉴于诊断为糖尿病患者或者数据集或没有,学会新的患者归类为患有糖尿病或没有。
无监督学习,没有给出一个答案的数据,让PC到组的事情。
给定一组在网络上发现的新闻文章,组到一组有关同一个故事的文章。
考虑到自定义数据的数据库,自动发现细分市场和集团客户分成不同的细分市场。
参考
Answer 13:
监督学习
在此,被用于训练网络的每个输入图案与输出模式,其是所述靶标或所需的图案相关联。 教师假设在学习过程中必须存在,当比较在网络的计算输出和正确的预期输出之间进行的,以确定错误。 然后,可以使用该错误改变网络参数,这导致性能的改进。
无监督学习
在这个学习方法中,目标输出不呈现给网络。 这是因为如果没有教师呈现所希望的图案,因此,该系统通过发现和适应于结构特征在输入学习图案自身。
Answer 14:
监督学习
你必须输入x和目标输出吨。 所以,你训练算法推广到缺少的部分。 因为目标是给它监督。 您是主管告诉算法:对于例如X,你应该输出t!
无监督学习
虽然分割,聚类和压缩在这个方向通常计数,我也很难拿出它一个很好的定义。
让我们自动编码器压缩为一个例子。 虽然你只需要输入x给出的,它是人类的工程师如何告诉算法,目标也X。 因此,在某种意义上说,这是不是从监督学习不同。
而对于集群和分割,我不太肯定它是否适合学习机的定义(见其他问题 )。
Answer 15:
监督学习:说一个孩子去金德花园。 这里的老师表示他3个玩具内部,球车。 现在老师给他10个玩具。 他会根据他以往的经验中的房子,球车3盒它们进行分类。 所以孩子最早是由教师获得正确答案为几套监督。 随后他被不明玩具测试。
无监督学习:再次幼儿园example.A儿童获得10个玩具。 他被告知段类似的报告。 因此基于形状,大小,颜色,功能等特点,他将努力使3组说A,B,C组他们。
这个词意味着监督你给监督/指令的机器帮它找到答案。 一旦获悉指令,它可以很容易地预测新情况。
无监督意味着没有监督或指导如何找到答案/标签和设备将使用其情报发现在我们的数据中的一些模式。 这不会使预测,它只是试图找到具有相似的数据集群。
Answer 16:
监督学习:你已标记数据,并从学习。 与价格一起如房屋数据,然后学会预测价格
无监督学习:你要找到趋势,进而预测,由于事先没有标签。 例如,不同的人在类,然后一个新的人来有啥组这种新型的学生属于。
Answer 17:
在监督学习 ,我们知道输入和输出应该是什么。 例如,给定一组汽车。 我们必须找出哪些红色,哪些蓝色。
然而, 无指导的学习是我们必须找出一个很少或没有对输出应该如何任何想法的答案。 例如,学习者或许能建当人们基于人脸的图案和文字等的相关性微笑检测模型“你在笑什么?”。
Answer 18:
监督学习可以标记一个新的项目为基础的培训期间学习训练的标签之一。 您需要提供大量的训练数据集,确认数据集和测试数据集。 如果您提供说出数字像素图像载体使用标签的训练数据一起,那么它可以识别的数字。
无监督学习不需要训练数据集。 在无监督学习它可以商品组合成不同的簇基于在所述输入矢量的差。 如果你提供的数字像素图像载体,并要求它分为10个大类,可能做到这一点。 但它确实知道如何标记它,你没有提供的培训标签。
Answer 19:
监督学习基本上是,你必须输入变量(X)和输出变量(y),并使用算法来学习从输入映射函数的输出。 为什么我们叫这是监督的原因是因为算法从训练数据集学习,算法迭代使得训练数据的预测。 监督有两种类型,分类和回归。 分类是当输出变量是类象是/否,真/假。 回归是当输出就像是人的高度,温度等实际值
联合国监督学习是我们只有输入数据(X),没有输出变量。 这就是所谓的无监督学习,因为不像监督学习上面有没有正确答案,也没有老师。 算法是留给自己图谋发现和数据呈现有趣的结构。
无监督学习的类型是集群和协会。
Answer 20:
监督学习基本上是从该机器学习训练数据已经被贴上了技术,是假设,你已经在训练中对数据分类的简单甚至奇数分类。 因此,使用“标记为”数据。
反之无监督学习是在机器本身的标签数据的技术。 或当机器从头开始学习本身,你可以说,它的情况。
Answer 21:
在简单的监督学习是通过使用标签,我们实现算法,如回归和分类.Classification被应用其中,我们的产量,就像是0或1,真/假形式机器学习中,我们有一些标签问题和类型,是/否。 和回归应用于从哪里把实际价值的价格这样的房子
无监督学习是一种机器学习问题中,我们没有任何标签,意味着我们只有一些数据,非结构化数据,我们必须利用各种无监督的算法来聚类数据(数据分组)
Answer 22:
监督机器学习
“算法的过程,从训练数据集学习和预测的输出。”
预测的输出的精度成正比的训练数据(长度)
监督学习,你必须输入变量(X)(训练数据集)和输出变量(Y)(测试数据集),并使用一种算法,从输入到输出了解映射功能。
Y = f(X)
主要类型:
- 分类(离散y轴)
- 预测(连续y轴)
算法:
分类算法:
Neural Networks Naïve Bayes classifiers Fisher linear discriminant KNN Decision Tree Super Vector Machines
预测算法:
Nearest neighbor Linear Regression,Multi Regression
应用领域:
- 分类的电子邮件为垃圾邮件
- 分类患者是否有疾病或不
语音识别
预测HR选择特定候选人或不
预测股市价格
Answer 23:
监督学习 :
受监督的学习算法分析所述训练数据和产生的推断功能,其可以被用于映射新的例子。
- 我们提供的训练数据,我们知道某一输入正确的输出
- 我们知道,输入和输出之间的关系
问题分类:
回归:连续输出=>地图输入变量的一些连续函数内预测的结果。
例:
考虑到一个人的照片,预言他的年龄
分类:在离散输出预测结果=>地图输入变量成离散的类别
例:
这是特纳癌变?
无监督学习:
无监督学习从没有被标记,分类或分类的测试数据获悉。 无监督学习识别共同点在数据并反应基于存在或不存在这样的共同之处在每个新的数据块。
我们可以通过聚类基于数据的变量之间的关系的数据得出这个结构。
没有根据预测结果的反馈。
问题分类:
聚类:是将一组中,在同一组中的对象这样的方式的对象的(称为簇)的任务更相似(在某些意义上)相互比那些在其他组(簇)
例:
就拿100万个不同基因的集合,并找到一种方法来自动组这些基因成团认为在某种程度上相似或不同的变量,如寿命,位置,角色等有关 。
流行的用例列在这里。
在数据挖掘分类和聚类之间的区别是什么?
参考文献:
Supervised_learning
Unsupervised_learning
机器学习从coursera
towardsdatascience
Answer 24:
监督学习
无监督学习
例:
监督学习:
- 一包苹果
一包橙色
=>构建模型
苹果和橘子的一个大杂烩。
=>请分类
无监督学习:
苹果和橘子的一个大杂烩。
=>构建模型
另一种鱼龙混杂
=>请分类
Answer 25:
在简单的话.. :)这是我的理解,随时纠正。 监督学习 ,我们知道我们提供的数据基础上预测。 因此,我们必须在一个需要为前提的数据集的一列。 无监督学习 ,我们尝试提取出来的意思所提供的数据集。 我们没有关于被预测什么清晰度。 那么问题是,为什么我们这样做.. :)答案是 - ?无监督学习的结果是组/集群(类似于数据一起)。 因此,如果我们收到任何新的数据,那么我们该关联与所标识的集群/组,并了解它的功能。
我希望这会帮助你。
Answer 26:
监督学习
监督学习是我们知道原始输入的输出,即数据被标记,使机器学习模型的训练过程中它会明白它需要在给定输出来检测,它会在训练过程中引导系统检测基础上,事先标记的对象,将检测这是我们在训练中已经提供了类似的对象。
这里的算法将知道什么是结构和数据的模式。 监督学习用于分类
作为一个例子,我们可以有一个不同的对象,其形状有方形,圆形,trianle我们的任务是安排在同一类型的形状的标记数据集已全部形状标记,我们将培训对数据集的机器学习模型中,基于培训dateset将开始检测的形状。
联合国监督学习
无监督学习是无导向学习,其中最终结果没有已知的,它会聚集数据集并基于其将分在不同的束中的对象,并且检测对象的对象的相似的性质。
这里的算法将搜索原始数据的不同模式,并根据其将数据集聚类。 无监督学习是用于群集。
作为一个例子,我们可以有多种形状方形,圆形,三角形不同的对象,因此将基于对象属性的串,如果一个对象有四条边,它会考虑的平方,如果它有三条边三角形,如果没有边圈相比,这里的数据是没有标签,它会学会自己来检测各种形状
Answer 27:
监督学习/预测模型:预测模型,顾名思义是用来根据历史数据来预测未来的结果。 预测模型通常给出从一开始就明确指示中需要学习什么,以及它如何需要学习。 这些类的学习算法被称为监督学习。
例如:监督学习时使用一个营销公司正试图找出哪些客户可能流失。 我们也可以用它来预测地震一样,龙卷风等危险的发生的可能性,旨在确定总保险价值。 的使用的算法的一些例子是:最近邻,朴素贝叶斯,决策树,回归等
无监督学习/描述性模型:它是用来训练在没有目标设定描述性模型,并没有单一的功能比其他重要。 无监督学习的情况下,可以是:当一个零售商希望找出什么是产品组合,客户往往更频繁地购买。 此外,在制药工业中,无监督学习可以用于预测哪些疾病可能与糖尿病沿发生。 这里使用的算法的例子是:K-均值聚类算法