交叉引用最简单的方式与常见的字符串文本文件CSV文件(Easiest way to cross-re

2019-08-31 17:50发布

我有一个CSV文件中的字符串列表,而另一个,我想寻找这些字符串文本文件。 该CSV文件只是我感兴趣的字符串,但文本文件有感兴趣的字符串(我感兴趣的字符串是蛋白质数据库ID号)穿插很多其他的文字。 会是什么的要对这个是最简单的方法是什么? 我要检查的文本文件,每串的CSV文件的存在。 我在研究实验室在顶级大学工作,所以你会帮助前沿的研究!

谢谢 :)

Answer 1:

我会使用Python这一点。 要打印匹配的行,你可以这样做:

import csv
with open("strings.csv") as csvfile: 
    reader = csv.reader(csvfile)
    searchstrings = {row[0] for row in reader}   # Construct a set of keywords
with open("text.txt") as txtfile:
    for number, line in enumerate(txtfile):
        for needle in searchstrings:
            if needle in line: 
                print("Line {0}: {1}".format(number, line.strip()))
                break   # only necessary if there are several matches per line


文章来源: Easiest way to cross-reference a CSV file with a text file for common strings