![大数据处理框架Apache Spark设计与实现在线阅读](https://wfqqreader-1252317822.image.myqcloud.com/cover/131/47379131/b_47379131.jpg)
会员
大数据处理框架Apache Spark设计与实现
许利杰等更新时间:2024-01-19 16:36:47
最新章节:参考文献开会员,本书免费读 >
近年来,以ApacheSpark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以ApacheSpark框架为核心,总结了大数据处理框架的基础知识、核心理论、典型的Spark应用,以及相关的性能和可靠性问题。本书分9章,主要包含四部分内容。第一部分大数据处理框架的基础知识(第1~2章):介绍大数据处理框架的基本概念、系统架构、编程模型、相关的研究工作,并以一个典型的Spark应用为例概述Spark应用的执行流程。第二部分Spark大数据处理框架的核心理论(第3~4章):介绍Spark框架将应用程序转化为逻辑处理流程,进而转化为可并行执行的物理执行计划的一般过程及方法。第三部分典型的Spark应用(第5章):介绍迭代型的Spark机器学习应用和图计算应用。第四部分大数据处理框架性能和可靠性保障机制(第6~9章):介绍Spark框架的Shuffle机制、数据缓存机制、错误容忍机制、内存管理机制等。
上架时间:2020-07-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
许利杰等
主页
同类热门书
最新上架
- 会员
剑指大数据:Flink实时数据仓库项目实战(电商版)
本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了电商行业Flink实时数据仓库的搭建过程。在整个项目的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并穿插了大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、电商业务概述、数据仓库理论介绍和数据仓库建模等。最核心的内容是代码中对Flink的灵活应用,为读者展示了Flink处理数据的多种可能计算机13.1万字 - 会员
MySQL 8.0从入门到实战
MySQL数据库是目前全球流行的数据库之一。《MySQL8.0从入门到实战》从入门到实战,系统全面、由浅入深地介绍MySQL数据库应用的各个方面。全书分为8个部分,共18章。第1部分(第1~3章)介绍MySQL的基础知识,包括初识MySQL、数据库设计和数据类型;第2部分(第4~6章)介绍MySQL的基本操作,包括SQL基础操作、MySQL连接查询和数据复制、MySQL基础函数;第3部分(第7、8计算机9.7万字 - 会员
数据分析实践:专业知识和职场技巧
《数据分析实践:专业知识和职场技巧》从初学者的角度出发,讲解了进阶为高级数据分析师所需的知识和技能,其中既包括数据分析岗位的介绍、发展现状及未来趋势,也包括实际工作中各环节的方法策略、实战案例,还包括职场中的困惑解答及面试指导。阅读本书,并基于本书进一步拓展所需要的知识能,可以帮助读者形成一套成系统、可实战的数据分析方法论。计算机19.6万字 - 会员
数据分析咖哥十话:从思维到实践促进运营增长
本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需计算机12万字 - 会员
达梦数据库开发实战
达梦数据库是一款非常优秀的国产数据库。本书从实用角度,通过对达梦数据库的体系结构、运行机制的讲解,以及与其他数据库相似功能的对比,帮助读者掌握达梦数据库的基本操作。本书第1章讲解达梦数据库的安装部署;第2章讲述达梦数据库的体系结构,并与Oracle的体系结构进行对比;第3章讲解数据库中最重要的两部分redo和undo;第4章介绍用户管理,重点讲述用户创建和权限;第5章讲解表和索引,并对普通表和堆表计算机10.7万字 - 会员
数据库原理及应用实验:基于GaussDB的实现方法
本书是《数据库原理——GaussDB技术及应用》一书配套的辅助教材。全书共分3部分:第一部分为实验指导,共有13个综合实验,每一个实验都是根据教学目标而设计,详细讲述了每一个实验的实验目的、实验任务及实验步骤,从而培养学生掌握关系数据库管理软件技术与应用的技能;第二部分为习题集,是根据主教材各章节内容编写的习题及习题答案,内容广泛,有填空、选择、简答、设计及实验题等多种形式,利求通过对这些习题的训计算机6.9万字 - 会员
深入浅出Greenplum分布式数据库:原理、架构和代码分析
本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现计算机7.1万字 - 会员
智能数据治理:基于大模型、知识图谱
本书基于我国深入实施网络强国和国家大数据战略的大背景,将“大语言模型”“知识图谱”“数据治理”相结合,阐述了大模型、知识图谱在智能数据治理中的应用实践,并以医疗、政务及降碳等行业为例,详细介绍了其数据治理流程及平台构建方法。书中首先阐述了大模型时代知识图谱和智能数据治理之间的协同关系,以儿童孤独症为例介绍了基于CiteSpace软件的医疗知识图谱的构建流程;其次详细阐述了基于神经网络模型的个人健康计算机13.1万字 - 会员
MySQL数据库实用教程
本书瞄准当前高校MySQL数据库教学与实验的需求,在MySQL8.0的基础上编写而成。全书分为两篇。第一篇为MySQL数据库基础,内容包含:数据库基础、MySQL语言、数据定义、数据操纵、数据查询、视图和索引、MySQL编程技术、MySQL安全管理、备份和恢复、事务管理、PHP和MySQL教学管理系统开发。第二篇为MySQL实验,所编排的各个实验与第一篇中的各章(除第10、11章外)内容相对应,计算机12万字
同类书籍最近更新
- 会员
企业大数据系统构建实战:技术、架构、实施与应用
本书第1~4章讲解企业大数据的战略规划,主要从宏观的角度介绍大数据的定位、组织保障、解决方案选择和自主实施思路,目的是从全局角度引导建立大数据工作的整体思维。第5~10章讲解企业大数据的落地实施,主要从执行层面介绍了大数据落地的相关技术、架构、开发、大数据工作流、应用和价值评估,直接以落地视角解读大数据工作中每个环节涉及的流程、知识和方法,这也是本书的核心章节。第11~13章讲解大数据的价值、变革数据库34.9万字 - 会员
数据库应用实战
本书分为4个部分,第1部分为数据库技术概述,第2部分介绍关系型数据库(包括MySQL、Oracle、SQLServer和PostgreSQL)技术应用,第3部分介绍NoSQL数据库(包括Redis、MongoDB、HBase、Hive、Cassandra和Elasticsearch)技术应用,第4部分介绍其他类型数据库(包括SQLite、Neo4j和TDengine)技术应用。本书按照统一的目录结数据库12.8万字 - 会员
标签类目体系:面向业务的数据资产设计方法论
本书共9章,分为3篇。由来篇(第1~3章)首先分析了当前各企业在数据建设过程中会遇到的6大数据困局,然后重点介绍了为应对这些数据困局而逐渐发展出的标签类目体系这一数据资产构建方法论及其定位、定义,最后阐述了采用该方法建设数据资产的3点必要性:资产可复用、业务可理解、价值可衡量。理论篇(第4~6章)详细讲解了标签类目体系方法论的4个核心原理、从核心原理衍生出的3个构建前提和6个设计步骤,以及标签方数据库15.5万字 - 会员
计算机应用基础项目化教程(微课版)
全书以Windows7和Office2010为平台,内容划分为走进计算机的世界、Windows7轻松玩转、速排工作文档、速算办公报表之Excel2010、速制演示文稿之PowerPoint2010、Office高级应用6个学习情境。本书对重点知识点和技能点都添加了微课,方便读者扫描二维码观看,轻松掌握相关知识。数据库18.3万字 - 会员
大数据处理之道
本书覆盖了当前大数据处理领域的热门技术,包括Hadoop、Spark、Storm、Dremel、Drill等,详细分析了各种技术的应用场景和优缺点;同时阐述了大数据下的日志分析系统,重点讲解了ELK日志处理方案;最后分析了大数据处理技术的发展趋势。本书采用幽默的表述风格,使读者容易理解、轻松掌握;重点从各种技术的起源、设计思想、架构等方面阐述,以帮助读者从根源上悟出大数据处理之道。数据库12.3万字 - 会员
大数据处理框架Apache Spark设计与实现
近年来,以ApacheSpark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以ApacheSpark框架为核心,总结了大数据处理框架的基础知识、核心理论、典型的Spark应用,以及相关的性能和可靠性问题。本书分9章,主要包含四部分内容。第一部分大数据处理框架的基础知识(第1~2章):介绍大数据处理框架的基本概念、系统架构、编程模型、相关的研究工作,并以一个典型的Spark应用为数据库11.9万字