欢迎您来到懒之才-站长的分享平台!   学会偷懒,并懒出境界是提高工作效率最有效的方法!
首页 > 教程文档 > python > Python数据科学实践指南[PDF][29.48MB]

Python数据科学实践指南[PDF][29.48MB]

2019-09-04 468 收藏 0 赞一个 0 真差劲 0 去评论 去下载

内容简介

本书分为三大部分,其中第1~4章是Python基础,这个部分会介绍阅读本书所必须掌握的Python知识。第5~7章是讲解Python直接提供的数据处理工具,这些工具包括一些易用的数据结构、标准库和第三方工具。第8~12章是一些实际的案例,将会涉及Python主要擅长的几个领域。后的三个附录分别介绍了关于Python的一些扩展知识。

目录

前言
第0章 发现、出发1
0.1 何谓数据科学1
0.1.1 海量的数据与科学的方法2
0.1.2 数据科学并不是新概念3
0.1.3 数据科学是一个系统工程3
0.2 如何成为数据科学家4
0.3 为什么是Python6
0.4 一个简单的例子8
第1章 Python介绍9
1.1 Python的版本之争10
1.2 Python解释器11
1.2.1 Mac OS X系统11
1.2.2 Linux系统11
1.2.3 Windows系统12
1.3 第一段Python程序14
1.4 使用Python shell调试程序15
第2章 Python基础知识19
2.1 应当掌握的基础知识19
2.1.1 基础数据类型19
2.1.2 变量和赋值21
2.1.3 操作符及表达式22
2.1.4 文本编辑器23
2.2 字符串27
2.3 获取键盘输入29
2.4 流程控制30
2.4.1 条件判断30
2.4.2 循环31
2.4.3 缩进、空白和注释33
第3章 函数及异常处理35
3.1 函数和函数的参数36
3.1.1 定义函数37
3.1.2 关键字参数和默认参数38
3.1.3 可变数量的参数39
3.1.4 递归40
3.2 闭包41
3.3 异常和断言44
第4章 高级字符串处理47
4.1 字符集和字符编码47
4.1.1 ASCII字符集和编码48
4.1.2 Unicode字符集及UTF-8编码49
4.2 字符串操作和格式化51
4.2.1 字符串的基本操作51
4.2.2 字符串分割52
4.2.3 字符串格式化52
4.3 正则表达式53
4.3.1 正则表达式入门54
4.3.2 在Python中使用正则表达式57
第5章 容器和collections60
5.1 元组60
5.2 列表62
5.2.1 引用传递64
5.2.2 列表解析式65
5.3 字典66
5.4 collections69
5.4.1 namedtuple69
5.4.2 Counter70
5.4.3 defaultdict71
5.4.4 OrderedDict71
第6章 Python标准库简介73
6.1 math模块73
6.1.1 常见常量73
6.1.2 无穷74
6.1.3 整数转换75
6.1.4 绝对值和符号76
6.1.5 常用计算77
6.1.6 指数和对数77
6.2 time79
6.3 random82
6.3.1 随机数生成器82
6.3.2 取样84
6.4 glob和fileinput85
6.5 bz2和gzip87
6.6 pprint88
6.7 traceback90
6.8 JSON91
第7章 用Python读写外部数据93
7.1 CSV文件的读写94
7.1.1 读取CSV文件94
7.1.2 创建CSV文件95
7.1.3 处理方言96
7.1.4 将读取的结果转换成字典97
7.2 Excel文件的读写98
7.2.1 读取Excel文件98
7.2.2 写Excel文件99
7.3 MySQL的读写101
7.3.1 写入MySQL103
7.3.2 读取MySQL105
第8章 统计编程106
8.1 描述性统计106
8.1.1 人口普查数据106
8.1.2 均值和中位数110
8.1.3 方差和标准差111
8.1.4 分布113
8.2 数据可视化入门116
8.2.1 pyplot基础116
8.2.2 柱状图和饼图119
8.3 概率122
第9章 爬虫入门124
9.1 网络资源及爬虫的基本原理124
9.2 使用request模块获取HTML内容127
9.2.1 关于HTTP协议127
9.2.2 使用requests的get方法获取HTML内容129
9.3 使用Xpath解析HTML中的内容133
9.3.1 HTML的层级和Xpath的基本概念134
9.3.2 使用谷歌浏览器快速创建Xpath路径137
9.3.3 使用谷歌浏览器复制需要JS渲染的HTML页面138
9.4 实战:爬取京东商品品类及品牌列表144
第10章 数据科学的第三方库介绍149
10.1 Numpy入门和实战149
10.1.1 Numpy基础150
10.1.2 Numpy基本运算153
10.1.3 Numpy高级特性159
10.1.4 kNN实战162
10.2 Pandas的入门和实战167
10.2.1 Pandas基础168
10.2.2 泰坦尼克号生存率分析实战176
10.3 Scikit-learn入门和实战180
10.3.1 机器学习术语181
10.3.2 Scikit-learn基础183
10.3.2 实战186
第11章 利用Python进行图数据分析193
11.1 图基础193
11.2 NetworkX入门194
11.2.1 基本操作194
11.2.2 为图中的元素添加属性196
11.2.3 有向图及节点的度数197
11.2.4 构建图及图的操作197
11.3 使用NetworkX进行图分析199
11.3.1 利用联通子图发现社区199
11.3.2 通过三角计算强化社区发现201
11.3.3 利用PageRank发现影响力中心202
第12章 大数据工具入门204
12.1 Hadoop204
12.1.1 Hadoop的计算原理205
12.1.2 在Hadoop上运行Python程序208
12.2 Spark211
12.2.1 为什么需要Spark211
12.2.2 如何学习Spark212
12.3 大数据与数据科学的区别215
附录A 编写Python 2与Python 3兼容的代码217
附录B 安装完整的Python开发环境225
附录C 常用的Python技巧235

文档截图

QQ截图20190904104638.jpg

Python数据科学实践指南[PDF][29.48MB]

一、推荐使用迅雷或快车等多线程下载软件下载本站资源。

二、未登录会员无法下载,登录后可获得更多便利功能,若未注册,请先注册。

三、如果服务器暂不能下载请稍后重试!总是不能下载,请点我报错 ,谢谢合作!

四、本站大部分资源是网上搜集或私下交流学习之用,任何涉及商业盈利目的均不得使用,否则产生的一切后果将由您自己承担!本站将不对任何资源负法律责任.如果您发现本站有部分资源侵害了您的权益,请速与我们联系,我们将尽快处理.

五、如有其他问题,请加网站设计交流群(点击这里查看交流群 )进行交流。

六、如需转载本站资源,请注明转载来自并附带链接

七、本站部分资源为加密压缩文件,统一解压密码为:www.aizhanzhe.com

下载地址
大家评论