欢迎您来到懒之才-站长的分享平台!   学会偷懒,并懒出境界是提高工作效率最有效的方法!
首页 > 教程文档 > 大数据 > Hadoop生态系统[PDF][53.91MB]

Hadoop生态系统[PDF][53.91MB]

2019-05-28 569 收藏 0 赞一个 0 真差劲 0 去评论 去下载

内容简介

本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。

主要包括如下主题:

核心技术。Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。

数据库和数据管理。Cassandra、HBase、MongoDB和Hive。

序列化。Avro、JSON和Parquet。

管理和监视。Puppet、Chef、Zookeeper和Oozie。

分析辅助。Pig、Mahout和MLLib。

数据传输。Scoop、Flume、distcp和Storm。

安全、访问控制和审计。Sentry、Kerberos和Knox。

云计算和虚拟化。Serengeti、Docker和Whirr。

目录

前言  1

第1章关键技术  7

11 Hadoop分布式文件系统(HDFS) 8

12 MapReduce  11

13 YARN  13

14 Spark   15

第2章数据库及数据管理  17

21 Cassandra 19

22 HBase  21

23 Accumulo 24

24 Memcached  26

25 Blur 28

26 Solr  30

27 MongoDB  32

28 Hive  34

29 Spark SQL ( 前身是 Shark) 36

210 Giraph  38

第3章序列化  41

31 Avro  43

32 JSON 46

33 Protocol Buffers (protobuf)  48

34 Parquet 50

第4章管理与监控 53

41 Ambari  54

42 HCatalog 56

43 Nagios 58

44 Puppet  59

45 Chef  61

46 ZooKeeper  63

47 Oozie  66

48 Ganglia  68

第5章分析辅助  69

51 MapReduce 接口69

52 分析库 70

53 Pig  72

54 Hadoop Streaming 74

55 Mahout 76

56 MLLib   78

57 Hadoop 图像处理接口(HIPI) 80

58 SpatialHadoop 81

第6章数据传输  83

61 Sqoop 85

62 Flume 87

63 DistCp 89

64 Storm  90

第7章安全、访问控制和审计  93

71 Sentry 95

72 Kerberos 97

73 Knox  99

第8章云计算和虚拟化  101

81 Serengeti 103

82 Docker105

83 Whirr  107

文档截图

QQ截图20190528100342.jpg

Hadoop生态系统[PDF][53.91MB]

一、推荐使用迅雷或快车等多线程下载软件下载本站资源。

二、未登录会员无法下载,登录后可获得更多便利功能,若未注册,请先注册。

三、如果服务器暂不能下载请稍后重试!总是不能下载,请点我报错 ,谢谢合作!

四、本站大部分资源是网上搜集或私下交流学习之用,任何涉及商业盈利目的均不得使用,否则产生的一切后果将由您自己承担!本站将不对任何资源负法律责任.如果您发现本站有部分资源侵害了您的权益,请速与我们联系,我们将尽快处理.

五、如有其他问题,请加网站设计交流群(点击这里查看交流群 )进行交流。

六、如需转载本站资源,请注明转载来自并附带链接

七、本站部分资源为加密压缩文件,统一解压密码为:www.aizhanzhe.com

下载地址
大家评论