-->

入门字与JWI和WORDNET茎(Getting word stems with JWI and W

2019-07-30 06:25发布

如何正确使用词干法在麻省理工学院的JWI(用于共发现的Java API),以获得一个字的茎实施? 我不知道如何初始化一个词干和使用findStems方法。

Answer 1:

你不需要额外的库,但你需要一本字典。 您可以从普林斯顿下载一个: https://wordnet.princeton.edu/wordnet/download/current-version/

我建议从一节“共发现3.1的数据库文件ONLY”提取存档文件只下载字典。 假设PATH /字典是你可以使用此代码的输出位置:

Dictionary dict = new Dictionary(new File("PATH/dict"));
dict.open();
WordnetStemmer stemmer = new WordnetStemmer(dict);

List<String> test = stemmer.findStems("feet", POS.NOUN);
for (int i = 0; i < test.size(); i++) {
    System.out.println(test.get(i));
}

这个例子的输出是“脚”。



Answer 2:

这意味着,以sakthi的回答评论:你确实有精确的实现POS你打电话的时候找(名词,形容词,动词等) findStems方法(JWI V2.2.3): HTTP://项目。 csail.mit.edu/jwi/api/edu/mit/jwi/morph/IStemmer.html



Answer 3:

使用的jar文件edu.mit.jwi_2.1.4.jar和edu.sussex.nlp.jws.beta.11.jar

JWS ws = new JWS("C:/Program Files/WordNet","2.1");  
WordnetStemmer stem =  new WordnetStemmer(ws.getDictionary());
System.out.println("test" + stem.findStems("reading") );


文章来源: Getting word stems with JWI and Wordnet
标签: java wordnet jwi