占美娜替代成本(Traminer substitution cost)

2019-10-21 23:05发布

我有一个过渡成本矩阵的逻辑问题。 我使用R包占美娜的序列差异性的工作。

我试着给你一个简单的例子(很简单,但我希望有用的解释我的问题):

有三个序列,我想是计算相似矩阵。 该字母是:H(健康),我(生病在家),IH(生病在医院),d(去世)

我观察3个科目为5层的意见。 这些是序列:

H – H – I – D – D 
H – I – I – I – D 
I – I – H – IH – IH 

置换成本矩阵是4×4表(状态X的状态)。 它必须是对称的? 这是我的逻辑问题:虽然可以从状态H,I或IH国家而死“过境”,相反是不合逻辑的。

我可以使用占美娜非对称替代成本矩阵?

如果,在我的数据库,置换成本(与计算出的sm = "TRATE"从状态,例如)“I”到“d”是低级(0.5)比从状态“I”到“IH”取代成本(0.6 )时,OM算法替代的“I”均可进行“d”,而不是“HI”。

Answer 1:

在我看来,你正在寻找一个自定义的代价矩阵。 它不是强制使用无论是TRATECONSTANT方法。

要创建一个自定义的矩阵你就必须做这样的事情:

myscm <- matrix(c(0,1,2, 
                  1,0,2, 
                  2,2,0), nrow=3, ncol=3) 
dist.om <- seqdist(my.seq, method="OM", sm=myscm)

其中myscm是您的自定义矩阵

这是取自http://lists.r-forge.r-project.org/pipermail/traminer-users/2011-July/000075.html

我相信你有两个选择:

1)创建的所有转换的理由,并完全自定义的矩阵

2)获取你已经生成的转换矩阵(使用seqsubm(your.seq, method = "TRATE")和仅更改不一致的值。 这就是我在最后的分析中已经做了。

但请记住,吉尔伯特提出的观点中的“非对称”的成对距离矩阵



Answer 2:

该转换率(估计转移概率)不应混淆替换费用。 替代成本应该反映各国之间的不同点。

升学率的基质(由返回seqtrate )是非对称的。

用于计算的距离,如最佳匹配距离的取代成本,必须是对称的。 否则,结果就不会距离矩阵,并输入这样的非对称矩阵,例如,一个聚类过程会导致意想不到的结果。

从升学率派生替代成本仅仅是一个过几种可能性来定义替换成本。 让$ P(I | j)的$是中转的概率从$ $Ĵ到$ I $,它由在限定的取代成本

$ C(I,J)= 2 - P(I | j)的 - P(j | I)$



文章来源: Traminer substitution cost