PCRE编码支持(PCRE Encoding Support)

2019-09-27 15:45发布

我在看到PCRE文档是PCRE支持UTF-8和Unicode通用类别属性,但我没有看到它说本地编码支持。

如果说支持ISO-8859-1:我在哪里可以找到有关信息?

简而言之:

香港专业教育学院比较与即时猜测,通过PHP支持的编码是Windows 1252,而不是ISO-8859-1编码。

if(preg_match('/€/',"\x80"))
    echo "Match";

ISO-8859-1没有在该位置的“€”。 Windows的1252一样。 或系统的dependes?

所以至极的是本地编码PCRE支持?

Answer 1:

正是这个实施例被用在regular-expressions.info描述从混合8位和Unicode的困难

混合Unicode和8位字符代码

总之,欧元符号是80h在所有的Windows代码页。 你的正则表达式引擎如何对待这个可能会有所不同。 它的工作原理,当你的正则表达式引擎是一个8位和文本文件使用的是Windows代码页。
如果你的正则表达式引擎是一个纯粹的Unicode的一个,它会读取\ X80的\ u0080这是一个控制代码。

所以,你是什么意思与本地编码PCRE支持? 这是系统dependend,你不应该依赖于某些代码页。

编码,它的好处是,你可以摆脱所有不同的代码页和所有从得到的问题。

因此,要使用unicode对于那些尝试匹配\x{20AC}这是欧元符号的Unicode代码点。

这里是一个概述有关Unicode的语法regular-expressions.info



文章来源: PCRE Encoding Support