欢迎您来到懒之才-站长的分享平台!   学会偷懒,并懒出境界是提高工作效率最有效的方法!
首页 > 教程文档 > 其他教程 > R语言数据分析项目精解:理论、方法、实战[PDF][43.14MB]

R语言数据分析项目精解:理论、方法、实战[PDF][43.14MB]

2019-12-01 895 收藏 0 赞一个 0 真差劲 0 去评论 去下载

内容简介

本书以互联网电商企业为背景,抽象出工作中常见的数据分析问题,利用 R 语言和统计学列出了详细的解决方案和过程。本书共 9 章,前两章分别为总论和 R 语言入门知识,之后各章分别介绍了运营指标的建立、指标监控系统、假设检验及 AB 测试、变量筛选技术、用户画像系统、寻找优质用户和文本挖掘等内容。本书涉及到的统计方法有:指标增长幅度量化方法、层次分析法、时间序列模型、基于正态分布的一元离群点检验、傅里叶谱分析、假设检验、主成分分析、因子分析、模糊聚类、无监督下连续型变量离散化、逻辑回归模型和文本挖掘等。另外,本书提供了所有实例的 R 语言实现代码,总计 33 个自定义函数和数千行代码。本书适合数据分析从业人员、产品运营人员、统计专业学生和 R 语言爱好者阅读。

目录

第 1 章 互联网 统计学 R 语言1
1.1 互联网中的统计学1
1.1.1 “互联网 ”的发展1
1.1.2 统计学的发展2
1.1.3 大数据时代的统计学2
1.2 R 语言——互联网与统计学的桥梁3
1.3 本书结构 5
第 2 章 R 语言基础 7
2.1 安装 R 语言 7
2.1.1 获取和安装 R 语言 7
2.1.2 安装 RStudio 9
2.1.3 R 包 10
2.1.4 帮助12
2.2 R 语言基本对象12
2.2.1 数据类型12
2.2.2 向量12
2.2.3 矩阵和数组19
2.2.4 列表27
2.2.5 数据框29
2.2.6 因子32
2.2.7 数据类型的辨别和转换39
2.2.8 数据类型和对象关系 39
2.3 工作空间和查看对象 40
2.3.1 工作空间和工作目录 40
2.3.2 遍历、创建、删除文件夹 41
2.3.3 查看对象的方法 42
2.4 数据导入和导出43
2.4.1 数据导入43
2.4.2 数据导出49
2.5 操作符和函数51
2.5.1 操作符51
2.5.2 函数54
2.6 数据集操作59
2.6.1 变量操作60
2.6.2 数据集操作63
2.6.3 数据集连接67
2.6.4 数据汇总68
2.7 控制流71
2.7.1 重复和循环71
2.7.2 条件执行73
2.7.3 next 和 break 74
2.8 自定义函数75
第 3 章 互联网运营指标的建立77
3.1 项目背景、目标及方案78
3.1.1 项目背景78
3.1.2 项目目标78
3.1.3 项目方案78
3.2 项目技术理论简介78
3.2.1 骨灰级流量指标 78
3.2.2 登录和激活80
2.2.3 访问深度和吸引力 81
3.2.4 订单指标85
3.2.5 网站或 APP 性能指标86
3.2.6 转化率87
3.2.7 层次分析法87
3.3 项目实践 92
3.3.1 搭建运营指标系统 92
3.3.2 制作对比型指标及趋势线 97
3.3.3 创建用户价值和活跃度指标 101
第 4 章 指标监控系统111
4.1 项目背景、目标及方案 111
4.1.1 项目背景111
4.1.2 项目目标111
4.1.3 项目方案112
4.2 项目技术理论简介112
4.2.1 时间序列基本统计量 112
4.2.2 数据观测与描述性统计 113
4.2.3 随机性115
4.2.4 周期性115
4.2.5 节假日模式识别 115
4.2.6 建模数据集的建立 118
4.2.7 指标监控方法(不含节假日)125
4.2.8 节假日指标监控方法 134
4.2.9 R 语言实例代码 135
4.3 项目实践 141
4.3.1 数据概览142
4.3.2 节假日模式识别 145
4.3.3 模型数据集的建立 155
4.3.4 指标监控(非节假日)160
4.3.5 节假日指标监控 176
4.3.6 总结181
第 5 章 用数据驱动业务——AB 测试 182
5.1 项目背景、目标和方案 182
5.1.1 项目背景182
5.1.2 项目目标183
5.1.3 项目方案183
5.2 项目技术理论简介183
5.2.1 自动化分流策略 183
5.2.2 整体评估指标185
5.2.3 概率论预备知识 186
5.2.4 假设检验191
5.2.5 三个问题197
5.3 项目实践 197
第 6 章 变量筛选技术204
6.1 项目背景、目标和方案 204
6.1.1 项目背景204
6.1.2 项目目标205
6.1.3 项目方案205
6.2 项目技术理论简介205
6.2.1 变量相关性206
6.2.2 变量筛选209
6.2.3 变量降维215
6.2.4 R 语言实例代码 225
6.3 项目实践 237
6.3.1 变量筛选238
6.3.2 变量降维243
第 7 章 构建用户画像系统 247
7.1 项目背景、目标和方案 247
7.1.1 项目背景247
7.1.2 项目目标248
7.1.3 项目方案248
7.2 项目技术理论简介248
7.2.1 用户画像的基本概念 248
7.2.2 用户画像应用领域 249
7.2.3 用户画像分类250
7.2.4 用户画像构建250
7.2.5 用户画像标签的数值处理方法 254
7.3 项目实践 256
第 8 章 从数据中寻找优质用户 261
8.1 项目背景、目标和方案 261
8.1.1 项目背景261
8.1.2 项目目标262
8.1.3 项目方案262
8.2 项目技术理论简介262
8.2.1 逻辑回归的基本概念 262
8.2.2 建模流程266
8.2.3 模型开发阶段269
8.2.4 模型验证阶段279
8.2.5 模型测试阶段285
8.2.6 商业应用流程288
8.2.7 R 语言实例代码 288
8.3 项目实践 295
8.3.1 数据探索295
8.3.2 数据处理297
8.3.3 建立模型302
8.3.4 模型验证304
8.3.5 总结308
第 9 章 文本挖掘——点评数据展示策略 309
9.1 项目背景、目标和方案 310
9.1.1 项目背景310
9.1.2 项目目标311
9.1.3 项目方案311
9.2 项目技术理论简介312
9.2.1 评论文本质量量化指标模型 312
9.2.2 用户相似度模型 313
9.2.3 情感性分析316
9.2.4 R 语言实例代码 321
9.3 项目实践 326
9.3.1 若干自定义函数 326
9.3.2 文本质量量化指标模型 329
9.3.3 用户相似度模型 334
9.3.4 情感性分析335
9.3.5 总结340

文档截图

QQ截图20191201163443.jpg

R语言数据分析项目精解:理论、方法、实战[PDF][43.14MB]

一、推荐使用迅雷或快车等多线程下载软件下载本站资源。

二、未登录会员无法下载,登录后可获得更多便利功能,若未注册,请先注册。

三、如果服务器暂不能下载请稍后重试!总是不能下载,请点我报错 ,谢谢合作!

四、本站大部分资源是网上搜集或私下交流学习之用,任何涉及商业盈利目的均不得使用,否则产生的一切后果将由您自己承担!本站将不对任何资源负法律责任.如果您发现本站有部分资源侵害了您的权益,请速与我们联系,我们将尽快处理.

五、如有其他问题,请加网站设计交流群(点击这里查看交流群 )进行交流。

六、如需转载本站资源,请注明转载来自并附带链接

七、本站部分资源为加密压缩文件,统一解压密码为:www.aizhanzhe.com

下载地址
大家评论