自然语言处理任务包括自然语言理解、自然语言处理和句法分析等。学习NLP意味着我们要学会如何理解语言、处理句子及各种歧义现象;学会如何有效地使用NLTK来进行文本分类、分词及词性标注等多个任务;学会如何分析词汇和句子结构,并掌握句法分析、语义分析、语用分析以及深度学习技术的应用。NLTK是处理NLP任 务的主要Python平台,自然语言处理应用了计算机程序设计来处理大规模的自然语言数据。需要了解NLTK提供的各类可利用的语料资源,以及如何使用WordNet。
陈钰枫《自然语言处理Python进阶》中文PDF+英文PDF+源代码
《自然语言处理Python进阶》中文PDF,375页,有目录,文字可复制;英文PDF,301页,有目录,文字可复制;配套源代码。作者: 克里希纳巴夫萨 译者:陈钰枫
下载: https://pan.baidu.com/s/1zV3NZLOJtG_Q-s7in8PthA
提取码: 3krk
学会如何实现命名实体抽取和句法分析,比如递归下降句法分析器、shift-reduce分析器和线图分析器等。使用LSTM技术基于莎士比亚著作生成文本。使用BABI数据集和LSTM技术对情景记忆建模。使用深度学习开发生成式聊天机器人。
李孟全《TensorFlow与自然语言处理应用》PDF+源代码
《TensorFlow与自然语言处理应用》PDF,414页,有目录,文字可复制;配套源代码。作者: 李孟全
下载: https://pan.baidu.com/s/12iagygRiaSQ_uqINnma4Hw
提取码: shfq
《TensorFlow与自然语言处理应用》分为12章,内容包括自然语言处理基础、深度学习基础、TensorFlow、词嵌入(Word Embedding)、卷积神经网络(CNN)与句子分类、循环神经网络(RNN)、长短期记忆(LSTM)、利用LSTM实现图像字幕自动生成、情感分析、机器翻译及智能问答系统。
冯志伟《自然语言处理综论第2版》PDF中英文
《自然语言处理综论第2版》中文PDF,827页,有目录,文字可复制。《自然语言处理综论第2版》英文PDF,1044页,有书签,文字可复制。作者: Daniel Jurafsky(D. 朱夫斯凯) / James H. Martin(J. H. 马丁) 译者: 冯志伟
下载: https://pan.baidu.com/s/1MH0iUDqg9VBalojg-IEXlw
提取码: 7cnh
讲述句法剖析的主要算法,包括CKY剖析算法、Earley剖析算法、统计剖析,并介绍合一与类型特征结构、Chomsky层级分类、抽吸引理等分析工具。介绍语义的各种表示方法、计算语义学、词汇语义学、计算词汇语义学,并介绍同指、连贯等计算机话语分析问题。
闫龙川《Python文本分析》PDF中英文F+代码
《Python文本分析》中文PDF,285页,文字可以复制。《Python文本分析》英文PDF,397页,文字可以复制。
配套源代码。作者: [印] 迪潘简·撒卡尔
下载: https://pan.baidu.com/s/1s30LJMsOJyk6sdHatqqVOQ
提取码: tyn2
提供了自然语言处理(NLP)和文本分析的主要概念和技术。包含了丰富的真实案例实现技术,例如构建分类新闻文章的文本分类系统,使用主题建模和文本摘要分析app或游戏评论,进行热门电影概要的聚类分析和电影评论的情感分析。
王昊奋《自然语言处理实践聊天机器人技术原理与应用》PDF
《自然语言处理实践聊天机器人技术原理与应用》PDF,198页,带目录,文字可复制。
作者: 王昊奋 等
下载: https://pan.baidu.com/s/1A9erGTD1SW3RgnzW13hOxw
提取码: 4j3f
阐述了聊天机器人的分类和关键技术,不仅给出了实际案例,还展望了聊天机器人在通往更智能化、更人性化、更趣味化的道路上所面临的挑战,针对聊天机器人在从感知智能到认知智能的跨越中所面临的难题,着重讨论了知识图谱和深度学习技术在自然语言处理、问答、推理、服务融合等方面的应用。
王斌《驾驭文本文本的发现组织和处理》PDF中英文+代码
《驾驭文本文本的发现组织和处理》中文PDF,342页,带目录,文字可复制;英文PDF,322页,带书签,文字可复制。配套源代码。
下载: https://pan.baidu.com/s/1ZDfOcOq5FCWmjwcMNvZ6Vg
提取码: uk44
通过实例来理解文本处理的这些概念和技术,利用现有的开源工具就可以自己实现实例。涵盖了文本处理概念和技术的多个方面,包括文本预处理、搜索、字符串匹配、信息抽取、命名实体识别、分类、聚类、标签生成、摘要、问答等。
唐聃《自然语言处理理论与实战》PDF代码+刘知远《大数据智能互联网时代的机器学习和自然语言处理技术》PDF
《大数据智能互联网时代的机器学习和自然语言处理技术》PDF,293页,带目录,文字可复制,彩色配图。刘知远等著。《自然语言处理理论与实战》PDF,362页,带目录,文字可复制;配套源代码。
下载: https://pan.baidu.com/s/1myY9s4LiDblxLf-7ZqEtJA
提取码: g8u6
以理论结合实例的方式将内容呈现出来。其中涉及开发工具、Python语言、线性代数、概率论、统计学、语言学等工程上常用的知识介绍,然后介绍自然语言处理的核心理论和案例解析,最后通过几个综合性的例子完成自然语言处理的学习和深入。
邱立坤《面向机器学习的自然语言标注》中文PDF+英文PDF
《面向机器学习的自然语言标注》中文PDF,312页,文字可复制,带书签;英文PDF,343页,文字可复制,带书签。
下载: https://pan.baidu.com/s/1ZDfOcOq5FCWmjwcMNvZ6Vg
提取码: uk44
数据标注实际上是在定义问题,这才是难点,挺有意思,了解了一些标注的方法和数据集,开阔眼界。内容全面、详略得当,结合实例讲解,更易理解。
冯志伟《自然语言处理简明教程》PDF+路彦雄《文本上的算法深入浅出自然语言处理》PDF
《自然语言处理简明教程(冯志伟)》PDF,980页,带目录。《文本上的算法深入浅出自然语言处理(路彦雄)》PDF,212页,带目录,文字可以复制。
下载: https://pan.baidu.com/s/13PUr5K_eJq-kyun9VsA3RA
提取码: gb6e
选择性地看了书中的部分章节,比如第9章隐马尔可夫模型是我感兴趣的。把向前算法和维特比算法解释地真是通俗易懂、超级详细,它对算法的介绍不是浅尝辄止,相反以举例子的形式介绍得非常详细。
兰红云《自然语言处理技术入门与实战》PDF
下载: https://pan.baidu.com/s/1ZDfOcOq5FCWmjwcMNvZ6Vg
提取码: uk44
深度学习计算任意词距离模型,FP-Growth算法实现词距离计算;N-Gram算法实现词距离计算;BP算法实现词距离计算拼音汉字混合识别模型。
《Python自然语言处理实战核心技术与算法》PDF+代码+涂铭
《Python自然语言处理实战核心技术与算法》PDF,303页,有书签目录,文字可以复制;配套源代码。作者:涂铭 / 刘祥 / 刘树春
下载: https://pan.baidu.com/s/1Jp02kwGY3HOkZw5Op5b55w
提取码: ry7e
讲解了情感分析相关的概念、场景以及一般做情感分析的流程,情感分析在很多行业都有应用。介绍了机器学习的重要概念,同时重点突出NLP常用的分类算法、聚类算法,还介绍了几个案例。
《知识图谱方法实践与应用》PDF+工具+王昊奋
《知识图谱方法实践与应用》PDF,481页,带目录,文字可复制,王昊奋编;配套实践工具和相关勘误。
下载: https://pan.baidu.com/s/18R8DGiGAkHdtafYLBlTVvg
提取码: h4jm
知识是智能的基础和核心,知识的建模、表示、获取、融合、推理、赋能等是人工智能及其相关应用的核心科学问题,知识图谱是其有效的技术实现手段。
车万翔《基于深度学习的自然语言处理》中文PDF+英文PDF
《基于深度学习的自然语言处理》中文PDF,274页,带目录,文字可复制。英文PDF,282页,带书签,文字可复制。
下载: https://pan.baidu.com/s/1v05L521Xr9le0IQCE7f6VA
提取码: 33ku
学习神经网络结构包括一维卷积神经网络、循环神经网络、条件生成模型和基于注意力的模型等在NLP中的应用。
《推荐系统算法实践》PDF+代码+黄美灵
《推荐系统算法实践》PDF,290页,带目录,文字可复制,配套源代码,黄美灵著。
下载: https://pan.baidu.com/s/1Fa3ilB-SQJ8MWAyyCYSoCg
提取码: nx39
讲解推荐系统中的排序算法,包括线性模型、树模型和深度学习模型,分别介绍逻辑回归、FM、决策树、随机森林、GBDT、GBDT+LR、集成学习、深度森林、DNN、Wide & Deep、DeepFM、YouTube推荐等模型的原理,以及其在Sklearn、Spark、TensorFlow主流工具中的实现与应用。
《Python自然语言处理》中文PDF+英文PDF+代码+张金超
《Python自然语言处理》中文PDF,631页,有目录,文字可复制;英文PDF,468页,有目录,文字可复制;配套源代码。作者:雅兰萨纳卡,译者: 张金超 / 刘舒曼
下载: https://pan.baidu.com/s/1bTObRcW8p7Q0WA15_O-S0g
提取码: qy3k
阐述了Python成为搭建自然语言处理系统的首选语言的原因,例如其强大的社区支持和众多便捷的框架。还对各种免费的语料和不同类型的数据集进行了介绍,便于针对具体的自然语言处理应用找到合适的数据和处理方法。
刚好学到word2vec,偶然发现一篇论文特别好但却用的是《Python自然语言处理》word2vec章节里面的一个例子,而且Jalaj Thanaki讲得更细致,然后就开始从这本书看起,真的给了我一个广泛开阔的视角去看待NLP(“开阔”相较于之间花大量的时间收效的狭窄的认知眼界),我觉得此刻我才明白NLP的任务、目标、概念、技术面横向上的大概,以及认知NLP基本的实现手法和起手一个项目时人的思路。这些,我真的觉得比我之前花两个月读完深度学习和漫长的时间在cs224上迷雾里折腾,有意思也有意义得多太多了!