我最近参加了一个类coursera关于“自然语言处理”,我学到了很多分析,IR和其他有趣的方面,例如Q&A等,虽然我掌握的概念很好,但我实际上并没有得到任何实用知识。 任何人都可以提出我要自然语言处理好网上教程或书吗?
谢谢
我最近参加了一个类coursera关于“自然语言处理”,我学到了很多分析,IR和其他有趣的方面,例如Q&A等,虽然我掌握的概念很好,但我实际上并没有得到任何实用知识。 任何人都可以提出我要自然语言处理好网上教程或书吗?
谢谢
您可以阅读Jurafsky和马丁的语音和语言处理(2008年版) ,这是该领域的标准教科书。 它的长,并具有多种主题的,所以我建议阅读只是真正应用到你的利益的章节。
此外,最好的学习方法是几乎可以肯定是真正从头开始执行NLP算法。 你可以挑选一些标准的任务(语言模型,文本分类,POS标记,NER,解析)并实现从地上爬起来的各种算法(NGRAM模型,HMM模型,朴素贝叶斯,最大墒,CKY)要真正了解是什么让他们的工作。 它也应该不会太难找一些免费的数据集,以测试你的实现。
最后,有很多的教程在那里为特定NLP算法都非常优秀。 例如,如果你想建立一个HMM,我建议杰森艾斯纳的教程也涵盖了平滑且无人监管的训练与EM。 如果你想实现Gibbs抽样无监督朴素贝叶斯训练,我建议菲利普雷斯尼克的教程 。
除了Jurafsky和马丁的书,克里斯托弗·D·曼宁和辛里奇Schütze的统计自然语言处理的基础也被广泛使用。 对于IR,Manning等。 还写了现代信息检索可以阅读或在他们的网站上在线下载。
如果您想对你怎么能对自然语言的工作实践知识,你应该开始实现它。 我建议使用NLTK(自然语言Proecessing工具包)和Python。 它很容易在python实现NLP。
您可以参考此链接http://nltk.org/
或者你可以在网上试穿http://cst.dk/online/pos_tagger/uk/
而不是读某本书,在深入研究的论文海可能是一个好主意。 http://www.aclweb.org ,例如,包含了NLP很多话题。 通过这些文件,你会得到更多的论文,其中一些是NLP的某个分支的基础引用。 而且,因为它们是由不同的作者写的,你不可能通过一个角度来看,过多的影响。
如果你是一个Java开发人员有教程对如何建立使用LingPipe在NLP系统的组件的广泛的名单http://alias-i.com/lingpipe/demos/tutorial/read-me.html 。 充分披露我写了一些这些教程和下面的书籍之一。
有几本书是在工业上更面向:
1)自然语言处理与Java由理查德·里斯中号
这包括如何做一些常见的任务,范围开源工具(包括LingPipe)的。
2)自然语言处理与Java和LingPipe食谱平装由布雷克·鲍德温,克里希纳Dayanidhi
这本书是在任务的“获取组件内置”级驱动,覆盖了主要的技术驱动是文本驱动的最NLP系统。 它不包括翻译。 它进入比第一本书详细且具有覆盖范围更广比LingPipe教程,但比教程有时少细致。
布瑞克
有要求的教学和学习材料的枢纽TeLeMaCo 。 你可以找到资源,NLP的许多方面,你可以轻松地添加你已经在网络上找到更多的材料。