我上了一个大的数据集的工作有超过300K的元素,并运行一些回归分析,试图估计使用预测变量的距离称为率参数。 我有回归方程。 现在我想的信心和预测区间。 我可以很容易地通过该命令的系数的置信区间:
> confint(W1500.LR1, level = 0.95)
2.5 % 97.5 %
(Intercept) 666.2817393 668.0216072
Distance 0.3934499 0.3946572
这让我对系数的CI的上限和下限。 现在我想的预测区间相同的上限和下限。 只有到目前为止,我还学到的是,我可以得到距离的特定值的预测区间使用的代码(比如200,500等):
predict(W1500.LR1, newdata, interval="predict")
因为我有超过30万不同的距离值,因此需要对他们每个人运行该代码这是不是对我很有用。 任何简单的方式来获得像confint命令我上面显示的预测区间?
不得不弥补我自己的数据,但是在这里你去
x = rnorm(300000)
y = jitter(3*x,1000)
fit = lm(y~x)
#Prediction intervals
pred.int = predict(fit,interval="prediction")
#Confidence intervals
conf.int = predict(fit,interval="confidence")
fitted.values = pred.int[,1]
pred.lower = pred.int[,2]
pred.upper = pred.int[,3]
plot(x[1:1000],y[1:1000])
lines(x[1:1000],fitted.values[1:1000],col="red",lwd=2)
lines(x[1:1000],pred.lower[1:1000],lwd=2,col="blue")
lines(x[1:1000],pred.upper[1:1000],lwd=2,col="blue")
所以你可以看到你的预测是构建间隔公测系数预测新的数据值,而不是。 所以,你真正想要的置信区间将在从conf.int同样的方式获得。