对于一个网站,需要从孩子们输入我们需要过滤他们时,他们在网站上输入自己的意见(运行PHP)使用任何淘气/脏话。
该评论是自由的领域,用户可以输入他们想要的任何意见。 我能想到的解决方案是有一个词表像黑名单:不好,不好,一句话,woord,craap,craaaap,(我们可与所有列入黑名单的话填补这个)。
然后,当保存表单,我们可以看一下名单,如有的话是存在,那么我们不会允许要保存的注释。
但该方法的prolem的是,他们可以通过添加字母的话,使其跳过过滤器EG得到解决:shiiiiit
让我知道你的想法是创建这些话的一些过滤器的最佳途径。
你永远不会成为能够过滤掉所有排列。 也许最可行的解决方案是过滤明显,并实施了“举报”机制,让别人可以手动查看(和拒绝)犯罪嫌疑人的意见。
所以,你要禁止该死,该死,该死,该死,和狗屎?
黑名单是不是在Unicode的年龄可行的解决方案。 然而,禁止€彻底似乎过高。
如果你有足够的时间,这是关于阅读值得斯肯索普问题 。
杰夫阿特伍德也有一个帖子淫秽过滤器是徒劳的 。
由于太多的PHP,我发现了一些链接,这可能是你的情况的解决方案:
- http://wiki.cdyne.com/wiki/index.php?title=Profanity_Filter
- http://www.webpurify.com/
使用uClassify训练差评,当系统训练的不够好,你可以标记违规为审核的评论。
也总有过滤像“低音”当然包括的这是不允许的词一个词的可能性。 目前,一些好的版主看起来像这样的问题的最佳解决方案。