我使用LIBSVM。 说我的特征值是按以下格式:
instance1 : f11, f12, f13, f14
instance2 : f21, f22, f23, f24
instance3 : f31, f32, f33, f34
instance4 : f41, f42, f43, f44
..............................
instanceN : fN1, fN2, fN3, fN4
我觉得有两个比例可以应用。
缩放每个实例向量,使得每个矢量具有零均值和单位方差。
( (f11, f12, f13, f14) - mean((f11, f12, f13, f14) ). /std((f11, f12, f13, f14) )
缩放上述矩阵到一个范围的每个式柱。 例如[-1,1]
据我的实验与RBF内核(LIBSVM)我发现第二缩放(2)提高了约10%的结果。 我不明白为什么(2)给了我一个更好的结果的原因。
可能有人给我解释一下什么是应用缩放,为什么第二个选项让我提高成绩的原因是什么?