生成预测值进行因子变量的水平(Generating predicted values for lev

2019-08-16 16:28发布

我使用的回归在连续结果变量的一些因素变量的lm() 例如,

fit<-lm(dv~factor(hour)+factor(weekday)+factor(month)+factor(year)+count, data=df)

我想生成预测值( yhat而在它们的中值或模态值保持其他变量为不同水平的因子可变的)。 例如,我怎么会产生yhat针对不同平日同时保持其他因素不变?

Answer 1:

我也许能够基于@罗兰的意见,以协助。 我想你想普通的旧方差分析,这有助于确定因素是很重要与否。 有没有必要在这里因素,整数或数字(类:数字),做工精细。 我总结了以下代码示例:

#creates df
(df <- data.frame(h=c(1,3,4,0,2, 3),d=c(2*1:3), m=c(-1, 0, 3, 4, 7, 8), y=c(30,28,27,26,22, 21)))

#creates linear model, gives output
(fit<-lm(df$d~ df$h + df$m+ df$y))

#runs ANOVA on linear model
anova(fit)

#creates predictions from lm based on different values of df$h
predict.lm(fit)

方差分析是一个回归的一种特殊情况。 输出会告诉你的因素是否是由P值显著。

> anova(fit)
Analysis of Variance Table

Response: df$d
          Df  Sum Sq Mean Sq F value  Pr(>F)  
df$h       1 13.2923 13.2923 89.5846 0.01098 *
df$m       1  2.2832  2.2832 15.3879 0.05927 .
df$y       1  0.1277  0.1277  0.8608 0.45147  
Residuals  2  0.2968  0.1484     

在这个例子小时是非常高度与因变量天相关,而几个月显示,未来相关性最高。

请参阅链接的背景 -

http://www.cookbook-r.com/Statistical_analysis/ANOVA/

仅供参考 - 我建议你包括一些源代码来创建你的榜样。 这样谁试图回答你的问题的人都可以指代相同的例子。

FYI2 - 我建议你添加标记“回归”

HTH。



文章来源: Generating predicted values for levels of factor variable
标签: r regression