写的很好,很好的介绍了有关Spark技术的基础知识以及相关知识,广度很好
总的来说写的东西多也比较严谨,但是页数限制,不至于成为葵花宝典
就当一个spark学习目录吧 东西是很全,但是每个知识点都讲的太短,作者为了讲更多的东西把很多高深的知识点浓缩成几百字,卷积网络一点是一点没看懂
面向数据,一切都是数据,行为是可运行的数据。 神: 1方法声明 2 trait:方法声明的集合 3 抽象类:方法声明的集合加上部分方法的实现加数据 4 类:方法加数据 形: 1 方法实现 2 对象 形托于神
这本书出版很新,涵盖以spark为核心的大数据生态技术,可以供学习参考
介绍很条理,包括spark的发展历史,这些详细梳理在官方的tutorial中是看不到的。 除了spark工具介绍,也对数据仓库架构和数据湖架构做了比较,有一个简单的例子介绍lambda架构
Spark源自加州大学伯克利分校的AMP实验室,经过开源社区的多年耕耘,目前已发展成大数据生态圈中最重要的技术之一。Spark的流行不仅在计算机从业人员中,而且一些业务人员、产品经理也经常用Spark进行数据分析,Spark的影响力可见一斑。书中心心念念的Spark 3.0.0已经于2020年6月18日发布了!
推荐阅读,虽然对新手不友好,关于基础部分一笔带过。但是,观其后面部分,能开阔思路,学习一些新的知识和相关的业务场景。