ANN(人工神经网络)和SVM(支持向量机)是监督机器学习和分类两种流行的策略。 这不是经常清楚哪些方法是为特定的项目好,我敢肯定的答案总是“看情况”。 通常情况下,使用两个与贝叶斯分类一起的组合。
#2这些问题已经被问关于ANN VS SVM:
ANN和SVM分类
什么在我的分类问题中ANN,SVM和KNN的区别
支持向量机和人工神经网络的文字处理?
在这个问题上,我想知道具体是什么方面的ANN(具体来讲,多层感知)的可能会使它需要使用过的SVM? 我想问的原因是因为它很容易回答的问题相反 :支持向量机往往优于人工神经网络,因为它们避免了人工神经网络的两大弱点:
(1)人工神经网络往往汇聚局部最优而不是全局最优,这意味着他们基本上是“因小失大”有时(或缺少树木,不见森林)
(2)人工神经网络往往过拟合如果训练时间过长,这意味着对于任何给定的模式,一个神经网络可能会开始考虑噪声模式的一部分。
支持向量机不会从以下两种问题的困扰。 然而,这不是显而易见的是,支持向量机意味着是对人工神经网络总更换。 那么具体有什么优势(s)没有一个ANN有超过一个SVM,可能使之适用于某些情况? 我列出了SVM的具体优于人工神经网络,现在我想看到的ANN优势列表(如果有的话)。
从您提供的,我假设,通过人工神经网络,你的意思是多层前馈网络(FF网的简称),如多层感知的例子来看,因为这些都是与支持向量机的直接竞争。
这些模型有超过支持向量机的一个具体的好处是,它们的大小是固定的:它们是参数模型,同时支持向量机的非参数。 也就是说,在一个ANN您通过H N具有尺寸H 1一堆隐藏层的视功能偏置参数的数量,再加上,和那些让你的模型。 与此相反,一个SVM(至少一个核化的一个)由一组支持向量,从训练集中选择的,与每一个的权重的。 在最坏的情况下,支持向量的数目正好是训练样本的数目(尽管这主要发生与小训练集或在退化例),在它的一般模型的大小成线性比例。 在自然语言处理,SVM分类与数以万计的支持向量,每个具有几十万的特点,是不是闻所未闻的。
此外, 在线培训相比,在线SVM配件FF网是非常简单的,并且预测可以说是相当快一点。
编辑 :所有上述涉及核化支持向量机的一般情况进行说明。 线性SVM是因为它们的参数,并允许用简单的算法,随机梯度下降这样的在线学习的一个特例。
过支持向量机人工神经网络中的一个明显的优点在于,神经网络可以具有任意数量的输出,而支持向量机只有一个。 最直接的方法来创建基于支持向量机n元分类是建立n支持向量机和一列火车每其中之一。 在另一方面,神经网络n元分类可以一气呵成的培训。 此外,神经网络会更有意义,因为它是一个整体,而支持向量机是隔离的系统。 如果输出是相互关联的,这尤其有用。
例如,如果目标是手写数字进行分类,十分支持向量机会做。 每个支持向量机将承认恰好有一个数字,并没有认识到所有其他人。 由于每个手写数字不能意味着持有多只它的类的详细信息,这是没有意义的尝试用人工神经网络来解决这个问题。
然而,假设目标是一个人的激素平衡(对于几种激素)作为容易测量的生理因素的函数模型,例如,因为最后一餐,心脏率等时间......由于这些因素都是相互关联的,人工神经网络回归使得比支持向量机回归更有意义。
有一点要注意的是,这两个实际上是非常相关的。 线性支持向量机相当于单层NN的(即,感知器),和多层神经网络可以支持向量机来表示。 见这里的一些细节。
如果你想使用一个内核SVM你必须猜测内核。 然而,人工神经网络是具有仅猜测做通用逼近是宽度(近似精度)和高度(近似效率)。 如果你正确地设计优化问题,你不要过度拟合(请参阅过拟合参考书目)。 这也取决于训练的例子,如果他们正确地扫描,均匀的搜索空间。 宽度和深度发现是整数规划的主题。
假设你有界函数f(。)和上界我通用逼近= [0,1]与范围再次I = [0,1]例如由紧凑支持U真实序列参数化(。,a)用为存在序列与序列中的属性
lim sup { |f(x) - U(x,a(k) ) | : x } =0
和绘制实施例和试验(x,y)
上分布d IxI
。
对于规定的支撑,你要做的就是找到最好的一个,使得
sum { ( y(l) - U(x(l),a) )^{2} | : 1<=l<=N } is minimal
让这a=aa
这是一个随机变量的!过拟合然后
平均使用D and D^{N} of ( y - U(x,aa) )^{2}
让我来解释为什么,如果你选择aa
使得误差最小化,然后是一套罕见的价值观,你有完美的结合。 然而,由于他们是罕见的,平均是从来没有0你想虽然你有一个离散逼近D.而且记住,支持长度可以自由地减少第二。
答案之一,我在这里失踪:多层感知是目前能找到的功能之间的关系。 例如,当原始图像被提供给学习算法和现在复杂的功能,计算它是在计算机视觉必要的。 本质上,中间水平可以计算出新的未知功能。
我们还应该考虑的是,SVM系统可以直接应用于非度量空间,如设置标记图形或字符串。 事实上,内部内核函数可适当推广到几乎任何类型的输入,提供内核的正定性的要求得到满足。 在另一方面,为了能够在一组标记图的使用ANN,明确的嵌入程序必须加以考虑。
文章来源: What are advantages of Artificial Neural Networks over Support Vector Machines? [closed]