我有一个过渡成本矩阵的逻辑问题。 我使用R包占美娜的序列差异性的工作。
我试着给你一个简单的例子(很简单,但我希望有用的解释我的问题):
有三个序列,我想是计算相似矩阵。 该字母是:H(健康),我(生病在家),IH(生病在医院),d(去世)
我观察3个科目为5层的意见。 这些是序列:
H – H – I – D – D
H – I – I – I – D
I – I – H – IH – IH
置换成本矩阵是4×4表(状态X的状态)。 它必须是对称的? 这是我的逻辑问题:虽然可以从状态H,I或IH国家而死“过境”,相反是不合逻辑的。
我可以使用占美娜非对称替代成本矩阵?
如果,在我的数据库,置换成本(与计算出的sm = "TRATE"
从状态,例如)“I”到“d”是低级(0.5)比从状态“I”到“IH”取代成本(0.6 )时,OM算法替代的“I”均可进行“d”,而不是“HI”。
在我看来,你正在寻找一个自定义的代价矩阵。 它不是强制使用无论是TRATE
或CONSTANT
方法。
要创建一个自定义的矩阵你就必须做这样的事情:
myscm <- matrix(c(0,1,2,
1,0,2,
2,2,0), nrow=3, ncol=3)
dist.om <- seqdist(my.seq, method="OM", sm=myscm)
其中myscm
是您的自定义矩阵
这是取自http://lists.r-forge.r-project.org/pipermail/traminer-users/2011-July/000075.html
我相信你有两个选择:
1)创建的所有转换的理由,并完全自定义的矩阵
2)获取你已经生成的转换矩阵(使用seqsubm(your.seq, method = "TRATE")
和仅更改不一致的值。 这就是我在最后的分析中已经做了。
但请记住,吉尔伯特提出的观点中的“非对称”的成对距离矩阵
该转换率(估计转移概率)不应混淆替换费用。 替代成本应该反映各国之间的不同点。
升学率的基质(由返回seqtrate
)是非对称的。
用于计算的距离,如最佳匹配距离的取代成本,必须是对称的。 否则,结果就不会距离矩阵,并输入这样的非对称矩阵,例如,一个聚类过程会导致意想不到的结果。
从升学率派生替代成本仅仅是一个过几种可能性来定义替换成本。 让$ P(I | j)的$是中转的概率从$ $Ĵ到$ I $,它由在限定的取代成本
$ C(I,J)= 2 - P(I | j)的 - P(j | I)$