Scala的解析器组合,二义性文法与剖析林(Scala Parser Combinator, Amb

2019-07-29 02:40发布

我试图让解析器通过评估它们对用户上下文/历史和知识基础,从一个模糊的语法返回所有可能的分析结果(剖析林),然后从剖析林。 出于性能方面的原因,这可能应该与packrat解析器和搜索限制/上限参数做LIMITE申请生产规则,以避免无限循环的递归调用的次数。

作为新Scala和它的解析器组合,我无法弄清楚如何做到这一点,或者是否可以在全部完成。 可能有人请帮忙吗? 非常感激。

最好的问候,托马斯·胡安

Answer 1:

你不能使用Scala内置的解析器组合做到这一点。 Packrat组合子仅限于明确的文法。 如果你试图解决歧义,你失去了memoize的能力和解析复杂度变O(K ^ N)甚至明确的路径。 所以,千万不要做。

你想要的是一个解析器组合框架,正确处理歧义。 据我所知,斯卡拉只有这样的框架是我的GLL组合程序 。 语法几乎是相同的Scala的解析器组合(其主要区别在于较高的arity功能正常工作),但输出的是Stream[A]其中A是的结果类型。 因此,你会得到一个剖析林。 请注意,结果实际上不是SPPF(共享包装剖析林),因此,如果您产生的结果的一个指数,该流将有比例的大小。 这样做是为了保持在结果类型最大的灵活性。

GLL组合子是在最坏情况下为O(n ^ 3),甚至对于病理暧昧语法。 在平均情况下,在那里解析线索是明确的,GLL组合子是O(n)。 恒定的时间开销是目前有点过分,但是优化是一个正在进行的项目。 我们使用GLL组合子生产的Precog ,所以你可以期待文库可以保持良好的前进。



文章来源: Scala Parser Combinator, Ambiguous Grammar & Parse Forest