我在看到PCRE文档是PCRE支持UTF-8和Unicode通用类别属性,但我没有看到它说本地编码支持。
如果说支持ISO-8859-1:我在哪里可以找到有关信息?
简而言之:
香港专业教育学院比较与即时猜测,通过PHP支持的编码是Windows 1252,而不是ISO-8859-1编码。
if(preg_match('/€/',"\x80"))
echo "Match";
ISO-8859-1没有在该位置的“€”。 Windows的1252一样。 或系统的dependes?
所以至极的是本地编码PCRE支持?
正是这个实施例被用在regular-expressions.info描述从混合8位和Unicode的困难
混合Unicode和8位字符代码
总之,欧元符号是80h
在所有的Windows代码页。 你的正则表达式引擎如何对待这个可能会有所不同。 它的工作原理,当你的正则表达式引擎是一个8位和文本文件使用的是Windows代码页。
如果你的正则表达式引擎是一个纯粹的Unicode的一个,它会读取\ X80的\ u0080这是一个控制代码。
所以,你是什么意思与本地编码PCRE支持? 这是系统dependend,你不应该依赖于某些代码页。
编码,它的好处是,你可以摆脱所有不同的代码页和所有从得到的问题。
因此,要使用unicode对于那些尝试匹配\x{20AC}
这是欧元符号的Unicode代码点。
这里是一个概述有关Unicode的语法regular-expressions.info