使用dplyr和时间序列的最佳实践,TS?(Best practices using dplyr a

2019-10-29 21:29发布

我有14.5年预算数据,合同编号,项目类型等与我试图建立一个18个月,时间序列预测。 该数据开始是由(非连续)日期合同编号个人支付。 使用Excel,我回转到按月支付的价款; 后来我将包括在一个月内总有效合同,合同类型的组成等总共有3134天行(满分5296)上,其中付款 - 上作了不记录在无天的付款这个数据*。

目前我使用的特性列表和结构如下(并非所有的功能都在下面,只是想获得一个模型的管道使用线性吨现在一起):

head(exp)
     Amount Day Month Year t
1  269909.4   5     7 2000 1
2  792078.6   6     7 2000 2
3  140065.5   7     7 2000 3
4  190553.2  11     7 2000 4
5  119208.6  12     7 2000 5
6 1068156.3  16     7 2000 6

> str(exp)
'data.frame':   3134 obs. of  5 variables:
 $ Amount: num  269909 792079 140066 190553 119209 ...
 $ Day   : int  5 6 7 11 12 16 17 21 26 28 ...
 $ Month : int  7 7 7 7 7 7 7 7 7 7 ...
 $ Year  : int  2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 ...
 $ t     : int  1 2 3 4 5 6 7 8 9 10 ...

我运行到这些问题/问题:

  1. Dplyr完全不顺心的ts()我在我的data.frame使用的对象,所以过滤和月/合同/合同类型排序不能正常工作。 什么是这里最好的方法呢? 我不能确定如何使用TS与时间序列,特别是涉及与其他产品进行兼容性的优点/缺点。

  2. *这是更容易,如果我开始与00年7月1日和14年12月31日之间的所有5296天的载体,以及一个t <- 1:5296和主要支付给天的那个完整列表,这些3134天?

文章来源: Best practices using dplyr and timeSeries, ts?