我工作的一个交通流预测,我可以预言,一个地方有重或轻的流量。 我已分类的每个流量为1-5,1为最轻的流量,5是最重的通信量。
我碰到这个网站http://www.waset.org/journals/waset/v25/v25-36.pdf ,AdaBoost算法,和我真的有学习算法困难。 特别是在其中部分S
是集合(( xi
, yi
), i=(1,2,…,m)
其中Y={-1,+1}
什么是x
, y
和常量L
? 什么是价值L
?
有人可以解释我这个算法? :)
S={(x1,y1),...,(xm,ym)}
:每个(x,y)
对是用于训练(或测试)的分类器的示例:
-
x
=其中描述该特定样品,例如,其值列出的特征amount of cars on the road
, day of the week
,等等 -
y
=对于一个特定的标签x
,而你的情况可以是1, 2, 3, 4 or 5
Table 1
中示出了纸张的x
他们使用的,即特征: DAY
, TIME
, INT
, DET
, LINK
, POS
, GRE
, DIS
, VOL
和OCC
。 表中的最后一列显示了标签( y
),它们设置为1
或-1
(即, yes
或no
)。 表中的每一行是1个样品。
L
是轮,其中AdaBoost的训练弱学习量(以纸张Random Forests
用作弱分类器)。 如果设置了L
到1
然后AdaBoost的运行1个回合只有1弱分类进行培训,这将有不好的结果。 执行与不同值的多个实验用于L
以找到最佳值(即,当AdaBoost算法收敛或启动时过拟合)。