Snakemake和熊猫语法(Snakemake and pandas syntax)

2019-09-29 09:14发布

我有一个输入文件如下

SampleName Run Read1 Read2
A run1 test/true_data/4k_R1.fq test/true_data/4k_R2.fq
A run2 test/samples/A.fastq test/samples/A2.fastq
B run1 test/samples/B.fastq test/samples/B2.fastq
C run1 test/samples/C.fastq test/samples/C5.fastq
D

所以我得到阵列中的所有指数法：

sample_table    = pd.read_table('samples.tsv', sep=' ', lineterminator='\n')
sample_table    = sample_table.drop_duplicates(subset='SampleName', keep='first', inplace=False)
sample_table    = sample_table.dropna()
sample_table.set_index('SampleName',inplace=True)
sample_ID=sample_table.index.values

此时sample_ID=['A' 'B' 'C']这是我想要的。然后我想设置一个变量R1，将对应是Read1和R2每个样品的Read2则。

rule all:
    input:
        expand("test/fltr/{ID_sample}.fq", ID_sample=sample_ID)

rule send_reads:
    input:
        #Tried both way but it does not work 
        r1=sample_table.loc["{ID_sample}",'Read1']
        r2=sample_table.Read2["{ID_sample}"]
    output:
       "test/fltr/{ID_sample}{input.r1}.fq"
    shell:
       "touch {output}"

我得到的错误

标签[{ID_sample}]不在[指数]

它是一个语法错误，或者更大的错误？

我刚开始使用Snakemake，我以为我已经教程后了解它，但显然我没有。

非常感谢，干杯

Answer 1:

lambda函数可以用来获取价值。

input:
    lambda wildcards, output: sample_table.Read2[wildcards.ID_sample]

此外，根据您的rule all ，你的output需要被test/fltr/{ID_sample}.fq 。而且，你必须使用逗号两个变量在不同的input 。

文章来源: Snakemake and pandas syntax

Snakemake和熊猫语法(Snakemake and pandas syntax)

Answer 1:

收藏的人(0)

举报内容

检举类型

检举原因

检举说明(必填)

打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮