大数据处理框架Apache Spark设计与实现在线阅读
会员

大数据处理框架Apache Spark设计与实现

许利杰等
开会员,本书免费读 >

计算机网络数据库11.9万字

更新时间:2024-01-19 16:36:47 最新章节:参考文献

立即阅读
加书架
下载
听书

书籍简介

近年来,以ApacheSpark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以ApacheSpark框架为核心,总结了大数据处理框架的基础知识、核心理论、典型的Spark应用,以及相关的性能和可靠性问题。本书分9章,主要包含四部分内容。第一部分大数据处理框架的基础知识(第1~2章):介绍大数据处理框架的基本概念、系统架构、编程模型、相关的研究工作,并以一个典型的Spark应用为例概述Spark应用的执行流程。第二部分Spark大数据处理框架的核心理论(第3~4章):介绍Spark框架将应用程序转化为逻辑处理流程,进而转化为可并行执行的物理执行计划的一般过程及方法。第三部分典型的Spark应用(第5章):介绍迭代型的Spark机器学习应用和图计算应用。第四部分大数据处理框架性能和可靠性保障机制(第6~9章):介绍Spark框架的Shuffle机制、数据缓存机制、错误容忍机制、内存管理机制等。
上架时间:2020-07-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行

最新章节

许利杰等
主页

同类热门书

最新上架

  • 会员
    本书全面介绍数据产品开发与经营,全书共13章,分为数据产品基础、数据产品开发、数据产品实践、数据产品经营四篇。第一篇深入分析国家和地方层面的数据资产政策,提出数据资产运营框架,并介绍数据资源的治理和数据产品。第二篇详细阐述数据产品开发三大策略、数据产品设计五步法、数据产品开发方法以及数据产品运营方法。第三篇全面介绍数据产品开发的实践案例,特别从数据要素型企业、数商型企业两个角度说明数据产品开发的实
    钱勇 项灵刚 林建兴 于冰冰等计算机33.6万字
  • 会员
    本书分为6篇,共14章。从OLAP核心概念出发,以Presto为例,从整体执行流程到不同SQL的执行原理,力图把OLAP查询的核心流程以一种系统化的方式来给读者讲清楚。第一篇背景知识(第1章和第2章)介绍OLAP的基础知识和Presto相关的背景知识,并给出了后续贯穿全书的SQL代码;第二篇核心原理(第3章和第4章)非常详细地串讲了SQL执行流程,介绍了执行计划的生成和优化;第三篇经典SQL(第5
    高英举 许一腾计算机19.7万字
  • 会员
    本书旨在帮助数据行业的从业者在AI时代提升数据管理和数据技术认知水平,内容覆盖数据价值创造的理论、技术和实践。本书共8章。第1章回顾企业数据的发展历史,并讲解现代企业数据组织。第2章从多维度解析数据价值的创造路径,包括从构建数字化决策、加速业务创新和推动AI变革等视角介绍数据价值创造的方法和成果。第3章系统讲解数据管理的方法与技术,包括数据资产管理、数据资产运营、数据平台架构的规划及实践案例。第4
    刘汪根 王志军 陈果编著计算机20.2万字
  • 会员
    云计算是一种商业计算模型,它将计算任务分布在大量计算机构成的资源池上,使用户能够按需获取计算能力、存储空间和信息服务。与以往的计算模式不同,云计算环境下,信息安全和服务保障问题更严重、更突出。本书从云计算的安全技术和服务质量评价两个方面论述云计算服务保障的体系架构,安全技术方面主要阐述了基于可信计算的实时度量、基于角色的数据隔离访问、云节点信任链的动态维护模型与验证机制和多级安全访问控制模型;服务
    林果园计算机9.5万字
  • 会员
    本书将从内部组件、外部应用和数据结构3个方面为读者介绍Redis常见、经典的用法与实例,并且所有实例均附有完整的Python代码,方便读者学习和参考。全书分3个部分:第一部分讲内部组件,介绍的实例通常用于系统内部,如缓存、锁、计数器、迭代器、速率限制器等,这些都是很多系统中不可或缺的部分;第二部分讲外部应用,介绍的实例都是一些日常常见的、用户可以直接接触到的应用,如直播弹幕、社交关系、排行榜、分页
    黄健宏计算机7.4万字
  • 会员
    本书从与数据要素关系最密切的信息、权属、价值、安全、交易等五个维度出发,汇聚不同学科背景的既有文献,整合现有观点,对数据要素的多维特性进行探讨,以丰富人们对数据要素的认知,凝聚共识,澄清数字时代的发展与治理迷思,为未来的相关创新提供起点。
    张平文 邱泽奇编著计算机14.5万字
  • 会员
    本书主要向读者介绍基于互联网技术的数据分析原理与方法,帮助读者理解并掌握数据分析能力,可使用到实践中并提升工作能力。本书具体内容包括学数据分析有什么用,数据分析的基础方法,数据分析的起点,数据分析的基础,数据分析的准备;通过数据分析看清现实,通过数据分析抓住业务增长机会,通过数据分析发现异常、处理异常、防止异常,通过数据分析预测与推荐,通过数据分析服务线下业务,数据分析结果汇报,以及让数据分析结果
    程靖计算机10.3万字
  • 会员
    《网络科学与网络大数据结构挖掘》作为网络科学的工具性图书共分两大模块:第一模块是基础理论,包括网络基本概念、网络拓扑性质、复杂网络社团挖掘等内容,旨在让读者熟悉一些基本的建模方法和分析技巧。第二模块为应用模块,包括复杂网络在几个代表性领域中的应用研究分析及案例剖析等。全书没有过多地数学和物理推导,而是更为关注网络科学的思维习惯和研究方式,兼具理论性、资料性和实践性。可用于各学科领域的教学及研究人员
    刘伟计算机0字
  • 会员
    本书较全面地介绍了MySQL数据库的基础知识及其应用。本书共11章,包括数据库基础,MySQL的安装与配置,数据库的基本操作,数据表的基本操作,表数据的增、改、删操作,数据查询,视图,索引,存储过程与触发器,事务,数据安全等内容。本书采用案例教学方式,每章以应用实例的方式阐述知识要点,再通过实训项目分析综合应用,最后辅以思考与练习巩固所学知识。应用实例、实训项目、思考与练习这3个部分分别采用3个不
    汪晓青主编计算机7.8万字