欢迎您来到懒之才-站长的分享平台!   学会偷懒,并懒出境界是提高工作效率最有效的方法!
首页 >教程文档 >其他教程 > 精通Python自然语言处理【PDF】【高清】【16.04MB】

精通Python自然语言处理【PDF】【高清】【16.04MB】

2018-12-12 169 收藏 0 赞一个 0 真差劲 0 去评论 去下载

内容简介

自然语言处理是计算语言学和人工智能之中与人机交互相关的领域之一。 本书是学习自然语言处理的一本综合学习指南,介绍了如何用Python实现各种NLP任务,以帮助读者创建基于真实生活应用的项目。全书共10章,分别涉及字符串操作、统计语言建模、形态学、词性标注、语法解析、语义分析、情感分析、信息检索、语篇分析和NLP系统评估等主题。 本书适合熟悉Python语言并对自然语言处理开发有一定了解和兴趣的读者阅读参考。

作者简介

对自然语言处理理论和算法感兴趣的读者,Python程序员对自然语言处理理论和算法感兴趣的读者,Python程序员对自然语言处理理论和算法感兴趣的读者,Python程序员

目录

第1章 字符串操作 1
1.1 切分 1
1.1.1 将文本切分为语句 2
1.1.2 其他语言文本的切分 2
1.1.3 将句子切分为单词 3
1.1.4 使用TreebankWordTokenizer
执行切分 4
1.1.5 使用正则表达式实现
切分 5
1.2 标准化 8
1.2.1 消除标点符号 8
1.2.2 文本的大小写转换 9
1.2.3 处理停止词 9
1.2.4 计算英语中的停止词 10
1.3 替换和校正标识符 11
1.3.1 使用正则表达式替换
单词 11
1.3.2 用另一个文本替换文本的
示例 12
1.3.3 在执行切分前先执行替换操作 12
1.3.4 处理重复字符 13
1.3.5 去除重复字符的示例 13
1.3.6 用单词的同义词替换 14
1.3.7 用单词的同义词替换的
示例 15
1.4 在文本上应用Zipf定律 15
1.5 相似性度量 16
1.5.1 使用编辑距离算法执行相似性度量 16
1.5.2 使用Jaccard系数执行相似性度量 18
1.5.3 使用Smith Waterman距离算法执行相似性度量 19
1.5.4 其他字符串相似性度量 19
1.6 小结 20
第2章 统计语言建模 21
2.1 理解单词频率 21
2.1.1 为给定的文本开发
MLE 25
2.1.2 隐马尔科夫模型估计 32
2.2 在MLE模型上应用平滑 34
2.2.1 加法平滑 34
2.2.2 Good Turing平滑 35
2.2.3 Kneser Ney平滑 40
2.2.4 Witten Bell平滑 41
2.3 为MLE开发一个回退机制 41
2.4 应用数据的插值以便获取混合
搭配 42
2.5 通过复杂度来评估语言模型 42
2.6 在语言建模中应用
Metropolis-Hastings算法 43
2.7 在语言处理中应用Gibbs
采样法 43
2.8 小结 46
第3章 形态学:在实践中学习 47
3.1 形态学简介 47
3.2 理解词干提取器 48
3.3 理解词形还原 51
3.4 为非英文语言开发词干
提取器 52
3.5 形态分析器 54
3.6 形态生成器 56
3.7 搜索引擎 56
3.8 小结 61
第4章 词性标注:单词识别 62
4.1 词性标注简介 62
默认标注 67
4.2 创建词性标注语料库 68
4.3 选择一种机器学习算法 70
4.4 涉及n-gram的统计建模 72
4.5 使用词性标注语料库开发
分块器 78
4.6 小结 80
第5章 语法解析:分析训练资料 81
5.1 语法解析简介 81
5.2 Treebank建设 82
5.3 从Treebank提取上下文无关
文法规则 87
5.4 从CFG创建概率上下文无关
文法 93
5.5 CYK线图解析算法 94
5.6 Earley线图解析算法 96
5.7 小结 102
第6章 语义分析:意义很重要 103
6.1 语义分析简介 103
6.1.1 NER简介 107
6.1.2 使用隐马尔科夫模型的
NER系统 111
6.1.3 使用机器学习工具包训练
NER 117
6.1.4 使用词性标注执行
NER 117
6.2 使用Wordnet生成同义词
集id 119
6.3 使用Wordnet进行词义消歧 122
6.4 小结 127
第7章 情感分析:我很快乐 128
7.1 情感分析简介 128
7.1.1 使用NER执行情感
分析 134
7.1.2 使用机器学习执行情感
分析 134
7.1.3 NER系统的评估 141
7.2 小结 159
第8章 信息检索:访问信息 160
8.1 信息检索简介 160
8.1.1 停止词删除 161
8.1.2 使用向量空间模型进行
信息检索 163
8.2 向量空间评分及查询操作符
关联 170
8.3 使用隐性语义索引开发IR
系统 173
8.4 文本摘要 174
8.5 问答系统 176
8.6 小结 177
第9章 语篇分析:理解才是可信的 178
9.1 语篇分析简介 178
9.1.1 使用中心理论执行语篇
分析 183
9.1.2 指代消解 184
9.2 小结 188
第10章 NLP系统评估:性能分析 189
10.1 NLP系统评估要点 189
10.1.1 NLP工具的评估(词性标注器、词干提取器及形态分析器) 190
10.1.2 使用黄金数据执行解析器
评估 200
10.2 IR系统的评估 201
10.3 错误识别指标 202
10.4 基于词汇搭配的指标 202
10.5 基于句法匹配的指标 207
10.6 使用浅层语义匹配的指标 207
10.7 小结 208

精通Python自然语言处理【PDF】【高清】【16.04MB】

一、推荐使用迅雷或快车等多线程下载软件下载本站资源。

二、未登录会员无法下载,登录后可获得更多便利功能,若未注册,请先注册。

三、如果服务器暂不能下载请稍后重试!总是不能下载,请点我报错 ,谢谢合作!

四、本站所有资源(包括模板、素材、软件、字体等)仅供学习与参考,请勿用于商业用途,否则产生的一切后果将由您自己承担!

五、如有其他问题,请加网站设计交流群(点击这里查看交流群 )进行交流。

六、如需转载本站资源,请注明转载来自并附带链接

七、本站部分资源为加密压缩文件,统一解压密码为:www.aizhanzhe.com

下载地址
大家评论
分享是个好习惯