我想分析开放式办公配套的hunspell格式化aff
和dic
文件。
英语aff
和dic
文件可以从这里下载,例如: http://extensions.openoffice.org/en/project/english-dictionaries-apache-openoffice
我想扫描指定的每一行.dic
文件并生成每行的每一个可能的字与所提供.aff
文件
我怎样才能做到这一点?
我已经安装了NHunspell框架,但它不具有的特点: https://www.nuget.org/packages/NHunspell/
例如,对于英语语言让我们考虑
make/UAGS
使得可以make, made, makes, making
等
现在我需要解析器来给我所有这些组合。 我怎样才能获得呢? 泰非常
所以基本上我想要扫描的字典的每一行,并从该行的字生成所有可能的话,我不知道我怎么做
我也可以写我自己的解析器,但在我看来,规则是非常复杂的,也没有详细和易于文档关于本
在这里我想基本上是这样。 图像解释的很清楚
给予analyze/ADSG
, en.dic
和en.aff
文件,并取得所有下面的话
analyze, analyzes, analyzing, analyzed, reanalyze, reanalyzes, reanalyzing, reanalyzed